[发明专利]一种自动校对姓名的方法及装置有效
申请号: | 200910236522.0 | 申请日: | 2009-10-23 |
公开(公告)号: | CN102043763A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 李少明 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 校对 姓名 方法 装置 | ||
技术领域
本发明涉及文字校对技术领域,尤其涉及一种自动校对姓名的方法及装置。
背景技术
目前在对文字校对领域中,当对文章中多次出现的姓名进行校对时,首先需要定义姓名词条,然后通过该姓名词条校对文章中出现的姓名。校对的过程包括:判断同一姓名前后是否一致,或判断姓名是否正确。通过姓名词条校对文章中出现姓名的过程如图1所示,该过程具体包括以下步骤:
S101:根据所校对的文章中出现的姓名,定义姓名词条,其中该定义的姓名词条中包括该校对的文章中出现的姓名。
例如所校对的文章中出现的姓名为李小锋,则定义姓名词条,该姓名词条中包括李小锋,并且确定该姓名为正确姓名。
S102:将出现的姓名的变形添加到姓名词条中。
例如对于上述姓名李小锋,其可能出现的变形包括:李晓锋、李小峰等等,将李晓锋、李小峰也添加到姓名词条中,该变形为需要校对出来的错误姓名。
S103:根据姓名词条对所校对的文章中出现的姓名进行校对,当确定文章中发现姓名词条中定义的错误姓名时,则提示错误,并提示用户修改。
现有技术基于姓名词条的姓名校对方法,当所校对的文章中出现多个姓名时,必须遍历所有需要校对的姓名,将该需要校对的姓名定义到姓名词条中,并且增加该姓名的变形。姓名词条的方式只可以校对出姓名词条中存在的姓名,及姓名的变形,当某一姓名,姓名的某一变形未添加到姓名词条中时,采用该方式就对该姓名的变形方式校对不出。只能在事后通过人工校对进行弥补,把相对应的姓名变形添加到姓名词条中,以防下次再出现类似的错误。但对于不同的文章需要校对的姓名也不同,这样每校对一篇文章就需要去修改和更新姓名词条,因此定义姓名词条的方式比较繁琐,校对的准确率也比较低,对应没有想到姓名的变形就校对不出来,容易出现不可挽回的事故。另外姓名词条的增加由于要考虑到尽可能多的姓名的变形,因此姓名词条的定义也成为了一项非常艰巨不可完成的任务。
发明内容
有鉴于此,本发明实施例提供一种自动校对姓名的方法及装置,用以解决现有技术中姓名校对工作效率低、准确性低的问题。
本发明实施例提供的一种自动校对姓名的方法,包括:
校对姓名装置根据设置的姓氏词库,在待校对的文章中进行匹配,获取每个包含姓氏的候选姓名;
统计每个候选姓名中每个字出现的频率,提取每个真实姓名;
根据所述提取的每个真实姓名,及待校对的文章的长度,确定所述待校对的文章中的每个目标真实姓名;
采用确定的所述每个目标真实姓名,对所述待校对的文章中的姓名进行校对。
本发明实施例提供的一种自动校对姓名的装置,包括:
候选姓名确定模块,用于根据设置的姓氏词库,在待校对的文章中进行匹配,获取每个包含姓氏的候选姓名;
真实姓名提取模块,用于统计每个候选姓名中每个字出现的频率,提取每个真实姓名;
目标真实姓名确定模块,用于根据所述提取的每个真实姓名,及待校对的文章的长度,确定所述待校对的文章中的每个目标真实姓名;
校对模块,用于采用确定的所述每个目标真实姓名,对所述待校对的文章中的姓名进行校对。
本发明实施例提供了一种自动校对姓名的方法及装置,该方法包括:校对姓名装置根据设置的姓氏词库,在待校对的文章中进行匹配,获取每个包含姓氏的候选姓名;统计每个候选姓名中每个字出现的频率,提取每个真实姓名;根据每个真实姓名,及该待校对的文章的长度,确定每个目标真实姓名;采用该确定的每个目标真实姓名,对该待校对的文章进行校对。在本发明实施例中校对姓名装置通过姓氏词库在待校对的文章中确定包含目标真实姓名的候选姓名,从而节省了定义每个姓名及姓名变型的繁琐工作,提高了姓名校对的效率,并且由于根据待校对文章中的每个真实姓名,确定目标真实姓名,从而提高了姓名校对的准确率。
附图说明
图1为现有技术中校对姓名的方法流程图;
图2为本发明实施例提供的一种自动校对姓名的方法流程图;
图3A为本发明实施例提供的确定目标真实姓名的结果示意图;
图3B为本发明实施例提供的一种自动校对姓名的装置结构图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910236522.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大容量电池并联接入系统
- 下一篇:一种快速充电型移动电源