[发明专利]一种身份证文字提取方法、系统及设备和存储介质在审
申请号: | 201810022673.5 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108154132A | 公开(公告)日: | 2018-06-12 |
发明(设计)人: | 梁栋;赵立军 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/32;G06K9/34 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 401121 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字轮廓 文字提取 身份证图像 身份证 感兴趣区域 系统及设备 定位信息 计算机可读存储介质 人脸识别技术 输入字符识别 存储介质 二维平面 轮廓分析 拍摄图像 限定条件 准确定位 字段信息 字符识别 准确率 人脸 引擎 合并 分割 分类 | ||
本发明公开了一种身份证文字提取方法、系统及设备和一种计算机可读存储介质,该方法包括:获取身份证图像,并根据所述身份证图像获取人脸的定位信息;根据所述定位信息提取所述身份证图像中的感兴趣区域;在所述感兴趣区域内获取文字轮廓,并根据所述文字轮廓的位置对所述文字轮廓按行进行分类;将同一类的所述文字轮廓合并为整行文字轮廓,并将所有的所述整行文字轮廓输入字符识别引擎中得到文字提取结果。本发明提供的身份证文字提取方法,采用人脸识别技术使得拍摄图像时对环境的要求大大降低,减少了限定条件,提高了分割定位精度。同时,采用轮廓分析充分利用二维平面信息,更准确定位字段信息,提高了身份证字符识别的准确率。
技术领域
本发明涉及字符识别领域,更具体地说,涉及一种身份证文字提取方法、系统及设备和一种计算机可读存储介质。
背景技术
身份证字符识别是计算机视觉技术的一类重要应用,该技术通过图像处理算法,自动识别身份证上载明的各类信息,如姓名、性别、住址、民族、身份证号码、证件有效期等,这类技术在各行各业有着广泛应用和潜在需求。目前身份证识别方法流程主要是采图像预处理、图像校正、感兴趣区域分割、字符识别等,在实际环境中,照片背景与身份证图片区域的分割以及分割后的字段分析会对识别效果产生较大影响。
现有技术中的身份证照片背景分离技术多采用限定采集环境的方式,将身份证置于比较简单的背景下采集照片,对光照和摄像头有一定限制,用户体验感较差。
现有技术在字段提取时,采用图像水平方向投影进行字段分割,通过分析投影结果判断身份证信息字段,字段分割容易受到倾斜和污点的干扰,投影过程是将二维平面像素数据投影到一维直线上,损失了空间分布信息,导致字符识别不准确。
因此,如何提高身份证字符识别的准确率是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供一种身份证文字提取方法、系统及设备和一种计算机可读存储介质,提高了身份证字符识别的准确率。
为实现上述目的,本发明提供了一种身份证文字提取方法,包括:
获取身份证图像,并根据所述身份证图像获取人脸的定位信息;
根据所述定位信息提取所述身份证图像中的感兴趣区域;
在所述感兴趣区域内获取文字轮廓,并根据所述文字轮廓的位置对所述文字轮廓按行进行分类;
将同一类的所述文字轮廓合并为整行文字轮廓,并将所有的所述整行文字轮廓输入字符识别引擎中得到文字提取结果。
其中,所述获取身份证图像之后,还包括:
对所述身份证图像进行缩放处理。
其中,根据所述定位信息提取所述身份证图像中的感兴趣区域,包括:
根据所述定位信息获取所述身份证的基准定位;
根据所述基准定位提取所述身份证图像中的感兴趣区域,并对所述感兴趣区域进行校正操作。
其中,在所述感兴趣区域内获取文字轮廓,包括:
将所述感兴趣区域按灰度等级分为黑色部分和白色部分,并检测文字轮廓。
其中,根据所述文字轮廓的位置对所述文字轮廓按行进行分类,包括:
获取所述文字轮廓的中心点纵坐标,将所述中心点纵坐标的差值小于预设值的相邻文字轮廓归为一类。
其中,所述将同一类的所述文字轮廓合并为整行文字轮廓之前,还包括:
筛选所有的所述文字轮廓,以便剔除误差轮廓。
为实现上述目的,本发明提供了一种身份证文字提取系统,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810022673.5/2.html,转载请声明来源钻瓜专利网。