[发明专利]字库更新方法、身份识别方法、装置及电子设备在审
申请号: | 202110090591.6 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112800240A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 刘伟韡;孙炎森;徐晓剑;马良有 | 申请(专利权)人: | 中信银行股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/126;G06K9/00;G06F21/31 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字库 更新 方法 身份 识别 装置 电子设备 | ||
本申请提供了一种字库更新方法、身份识别方法、装置及电子设备,应用于计算机技术领域,其中该方法当目标文字编码不属于编码库范围,基于目标文字图形以及所述证件的目标文字编码更新编码库以及目标字库,从而实现了字库扩展,进而解决因字体图形库对生僻字图像不完整、字码不一致问题,导致不能识别证件中的字体,影响生僻字客户开展金融业务的问题。
技术领域
本申请涉及计算机技术领域,具体而言,本申请涉及一种字库更新方法、身份识别方法、装置及电子设备。
背景技术
随着OCR技术的发展,因为其能迅速将印刷字识别为电脑可识别的字符,提升了信息识别、交互的速度,其应用领域越来越广泛。超过6000 万人的名字中使用了生僻汉字,大量的港澳台地区用户,名字中包含繁体字和异形字。
然而,ORC在生僻字识别方面,由于生僻字图形较为冷僻,且数量众多,因此对于生僻字证件的识别和比对,一直存在识别差、识别错和不能识别的问题;国内字符的统一编码管理较为分散,没有统一的国家标准,仅有部分技术规范指导文档。由相关部门等权威机构发布的证件,存在一字多码(一个字体图形,多个编码)的情况。如何有效识别证件中的冷僻字成为了问题。
发明内容
本申请提供了一种字库更新方法、身份识别方法、装置及电子设备,将确定的冷僻字更新字库,从而后续能够有效识别该些冷僻字,本申请采用的技术方案如下:
第一方面,提供了一种字库更新方法,包括:
确定证件的目标文字图形以及所述证件的目标文字编码,所述目标文字编码通过对所述目标文字图形进行OCR识别得到;
判断所述目标文字编码是否属于编码库范围;
如果所述目标文字编码不属于编码库范围,则基于所述目标文字编码更新所述编码库以及基于所述证件的目标文字图形更新目标字库;
建立所述编码库中目标文字编码与目标字库中目标文字图形的关联关系。
可选地,基于所述证件的目标文字图形更新目标字库,包括:
判断所述证件的目标文字图形是否属于所述目标字库;
如果所述证件的目标文字图形不属于所述目标字库,则将所述证件的目标文字图形添加至目标字库。
可选地,该方法还包括:
如果所述证件的目标文字图形属于所述目标字库,则不用所述证件的目标文字图形替换所述目标字库的原文字图形;
所述建立所述编码库中目标文字编码与目标字库中目标文字图形的链接,包括:
建立所述目标字库中原目标文字图形与更新后的编码库中目标文字编码的映射关系。
可选地,该方法还包括:
如果所述证件的目标文字图形属于所述目标字库,则确定所述证件的目标文字图形为一字多码,并基于所述目标文字编码更新一字多码库。
可选地,所述基于所述目标文字编码更新一字多码库,包括:
将目标字库中目标文字图形对应的原始文字编码以及所述目标文字编码添加至一字多码库,并建立两者的关联关系。
第二方面,提供了一种身份识别方法,包括:
确定目标对象的证件的文字图形及第一文字编码;
将所述目标对象的证件的文字图形及第一文字编码发送至相关部门的身份校验系统进行身份校验;
如果校验失败,则基于一字多码库判断所述目标对象的证件的文字图形是否属于一字多码;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中信银行股份有限公司,未经中信银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110090591.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卡片审核方法及装置
- 下一篇:人脸特征提取方法、装置、设备及存储介质