[发明专利]一种字符串模糊识别方法及装置在审
申请号: | 202110188818.0 | 申请日: | 2021-02-19 |
公开(公告)号: | CN112989140A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 荆峥;李凯;钱金鑫;郑嵘;柳亚坤 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘乐 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符串 模糊 识别 方法 装置 | ||
本发明提供了一种字符串模糊识别方法及装置,该方法包括:获取待识别字符串,并读取基础信息表中一个标准字符串;将待识别字符串和标准字符串中的相似字符进行归集;判断归集后的待识别字符串和归集后的标准字符串是否相同;如果归集后的待识别字符串和归集后的标准字符串不相同,读取基础信息表中的下一个标准字符串,并返回执行将待识别字符串和标准字符串中的相似字符进行归集;如果归集后的待识别字符串和归集后的标准字符串相同,将标准字符串作为待识别字符串的模糊识别结果。基于本发明,可以准确匹配到字符串,减少相似字符造成的失误。
技术领域
本发明涉及计算机系统应用技术领域,更具体地说,涉及一种字符串模糊识别方法及装置。
背景技术
现阶段,在银行的财会管理工作以及数据中心设备管理等工作中,常需要识别、核对和记录各类字符串。比如,应税事务工作中纳税人识别号作为纳税人唯一的身份证号,其是是数字和字母组成的字符串;再比如,设备管理员经常需要与设备的序列号(SerialNumber)打交道,序列号为字母、数字、字符组成的字符串。
但是,由于相似字符的原因,字符串信息经常有误,导致无法正确被识别。具体的,0与O,1与l,8与B,2与Z等外形相似的字符导致辨认困难,特别是在光线较暗、物理遮挡等不利视线条件下此问题尤为严重。
发明内容
有鉴于此,为解决上述问题,本发明提供一种字符串模糊识别方法及装置。技术方案如下:
一种字符串模糊识别方法,所述方法包括:
获取待识别字符串,并读取基础信息表中一个标准字符串;
将所述待识别字符串和所述标准字符串中的相似字符进行归集;
判断归集后的所述待识别字符串和归集后的所述标准字符串是否相同;
如果归集后的所述待识别字符串和归集后的所述标准字符串不相同,读取所述基础信息表中的下一个标准字符串,并返回执行所述将所述待识别字符串和所述标准字符串中的相似字符进行归集;
如果归集后的所述待识别字符串和归集后的所述标准字符串相同,将所述标准字符串作为所述待识别字符串的模糊识别结果。
优选的,所述读取基础信息表中一个标准字符串之前,所述方法还包括:
获取所述基础信息表对应的最短字符串长度;
判断所述待识别字符串的字符串长度是否小于所述最短字符串长度;
如果所述待识别字符串的字符串长度不小于所述最短字符串长度,执行所述读取基础信息表中一个标准字符串。
优选的,所述将所述待识别字符串和所述标准字符串中的相似字符进行归集之前,所述方法还包括:
剔除所述待识别字符串和所述标准字符串中连接字符。
优选的,所述读取所述基础信息表中的下一个标准字符串之前,所述方法还包括:
判断归集后的所述待识别字符串和归集后的所述标准字符串中一个字符串是否为另一个字符串的前缀或后缀;
如果归集后的所述待识别字符串和归集后的所述标准字符串中一个字符串不为另一个字符串的前缀或后缀,执行所述读取所述基础信息表中的下一个标准字符串。
优选的,所述方法还包括:
如果归集后的所述待识别字符串和归集后的所述标准字符串中一个字符串为另一个字符串的前缀或后缀,将所述标准字符串作为所述待识别字符串的模糊识别结果。
一种字符串模糊识别装置,所述装置包括:
第一处理模块,用于获取待识别字符串,并读取基础信息表中一个标准字符串;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110188818.0/2.html,转载请声明来源钻瓜专利网。