[发明专利]一种身份证文字提取方法、系统及设备和存储介质在审
申请号: | 201810022673.5 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108154132A | 公开(公告)日: | 2018-06-12 |
发明(设计)人: | 梁栋;赵立军 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/32;G06K9/34 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 401121 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字轮廓 文字提取 身份证图像 身份证 感兴趣区域 系统及设备 定位信息 计算机可读存储介质 人脸识别技术 输入字符识别 存储介质 二维平面 轮廓分析 拍摄图像 限定条件 准确定位 字段信息 字符识别 准确率 人脸 引擎 合并 分割 分类 | ||
1.一种身份证文字提取方法,其特征在于,包括:
获取身份证图像,并根据所述身份证图像获取人脸的定位信息;
根据所述定位信息提取所述身份证图像中的感兴趣区域;
在所述感兴趣区域内获取文字轮廓,并根据所述文字轮廓的位置对所述文字轮廓按行进行分类;
将同一类的所述文字轮廓合并为整行文字轮廓,并将所有的所述整行文字轮廓输入字符识别引擎中得到文字提取结果。
2.根据权利要求1所述身份证文字提取方法,其特征在于,所述获取身份证图像之后,还包括:
对所述身份证图像进行缩放处理。
3.根据权利要求1所述身份证文字提取方法,其特征在于,根据所述定位信息提取所述身份证图像中的感兴趣区域,包括:
根据所述定位信息获取所述身份证的基准定位;
根据所述基准定位提取所述身份证图像中的感兴趣区域,并对所述感兴趣区域进行校正操作。
4.根据权利要求1所述身份证文字提取方法,其特征在于,在所述感兴趣区域内获取文字轮廓,包括:
将所述感兴趣区域按灰度等级分为黑色部分和白色部分,并检测文字轮廓。
5.根据权利要求1-4任一项所述身份证文字提取方法,其特征在于,根据所述文字轮廓的位置对所述文字轮廓按行进行分类,包括:
获取所述文字轮廓的中心点纵坐标,将所述中心点纵坐标的差值小于预设值的相邻文字轮廓归为一类。
6.根据权利要求1所述身份证文字提取方法,其特征在于,所述将同一类的所述文字轮廓合并为整行文字轮廓之前,还包括:
筛选所有的所述文字轮廓,以便剔除误差轮廓。
7.一种身份证文字提取系统,其特征在于,包括:
获取模块,用于获取身份证图像,并根据所述身份证图像获取人脸的定位信息;
提取模块,用于根据所述定位信息提取所述身份证图像中的感兴趣区域;
分类模块,用于在所述感兴趣区域内获取文字轮廓,并根据所述文字轮廓的位置对所述文字轮廓按行进行分类;
合并模块,用于将同一类的所述文字轮廓合并为整行文字轮廓,并将所有的所述整行文字轮廓输入字符识别引擎中得到文字提取结果。
8.根据权利要求7所述身份证文字提取系统,其特征在于,所述分类模块具体为在所述感兴趣区域内获取文字轮廓,并获取所述文字轮廓的中心点横坐标,将所述中心点纵坐标的差值小于预设值的相邻文字轮廓归为一类的模块。
9.一种身份证文字提取设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述身份证文字提取方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述身份证文字提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810022673.5/1.html,转载请声明来源钻瓜专利网。