[发明专利]一种身份证文字提取方法、系统及设备和存储介质在审

申请号：	201810022673.5	申请日：	2018-01-10
公开（公告）号：	CN108154132A	公开（公告）日：	2018-06-12
发明（设计）人：	梁栋;赵立军	申请（专利权）人：	马上消费金融股份有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/20;G06K9/32;G06K9/34
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	罗满
地址：	401121 重庆市渝北区***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文字轮廓文字提取身份证图像身份证感兴趣区域系统及设备定位信息计算机可读存储介质人脸识别技术输入字符识别存储介质二维平面轮廓分析拍摄图像限定条件准确定位字段信息字符识别准确率人脸引擎合并分割分类
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种身份证文字提取方法、系统及设备和一种计算机可读存储介质，该方法包括：获取身份证图像，并根据所述身份证图像获取人脸的定位信息；根据所述定位信息提取所述身份证图像中的感兴趣区域；在所述感兴趣区域内获取文字轮廓，并根据所述文字轮廓的位置对所述文字轮廓按行进行分类；将同一类的所述文字轮廓合并为整行文字轮廓，并将所有的所述整行文字轮廓输入字符识别引擎中得到文字提取结果。本发明提供的身份证文字提取方法，采用人脸识别技术使得拍摄图像时对环境的要求大大降低，减少了限定条件，提高了分割定位精度。同时，采用轮廓分析充分利用二维平面信息，更准确定位字段信息，提高了身份证字符识别的准确率。

技术领域

本发明涉及字符识别领域，更具体地说，涉及一种身份证文字提取方法、系统及设备和一种计算机可读存储介质。

背景技术

身份证字符识别是计算机视觉技术的一类重要应用，该技术通过图像处理算法，自动识别身份证上载明的各类信息，如姓名、性别、住址、民族、身份证号码、证件有效期等，这类技术在各行各业有着广泛应用和潜在需求。目前身份证识别方法流程主要是采图像预处理、图像校正、感兴趣区域分割、字符识别等，在实际环境中，照片背景与身份证图片区域的分割以及分割后的字段分析会对识别效果产生较大影响。

现有技术中的身份证照片背景分离技术多采用限定采集环境的方式，将身份证置于比较简单的背景下采集照片，对光照和摄像头有一定限制，用户体验感较差。

现有技术在字段提取时，采用图像水平方向投影进行字段分割，通过分析投影结果判断身份证信息字段，字段分割容易受到倾斜和污点的干扰，投影过程是将二维平面像素数据投影到一维直线上，损失了空间分布信息，导致字符识别不准确。

因此，如何提高身份证字符识别的准确率是本领域技术人员需要解决的问题。

发明内容

本发明的目的在于提供一种身份证文字提取方法、系统及设备和一种计算机可读存储介质，提高了身份证字符识别的准确率。

为实现上述目的，本发明提供了一种身份证文字提取方法，包括：

获取身份证图像，并根据所述身份证图像获取人脸的定位信息；

根据所述定位信息提取所述身份证图像中的感兴趣区域；

在所述感兴趣区域内获取文字轮廓，并根据所述文字轮廓的位置对所述文字轮廓按行进行分类；

将同一类的所述文字轮廓合并为整行文字轮廓，并将所有的所述整行文字轮廓输入字符识别引擎中得到文字提取结果。

其中，所述获取身份证图像之后，还包括：

对所述身份证图像进行缩放处理。