[发明专利]一种低像素密度文本的识别方法有效
| 申请号: | 202010190222.X | 申请日: | 2020-03-18 |
| 公开(公告)号: | CN111414917B | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 李振;鲁宾宾;刘挺;陈伟强;陈远琴;孟天祥;翟昶 | 申请(专利权)人: | 民生科技有限责任公司 |
| 主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/14;G06V30/18;G06N3/0464;G06N3/08 |
| 代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
| 地址: | 101300 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 像素 密度 文本 识别 方法 | ||
本发明属于图像识别技术领域,涉及一种低像素密度文本的识别方法。该方法的具体步骤为:对待识别的低像素密度文本进行图像信息采集,并将采集的图像信息输入并进行预处理,进行初步定位;再次进行精确定位;根据得到精确定位结果进行图像信息区域识别,并对识别后的结果进行分类,将分类数据分别输入特殊符号识别模型和普通文本识别模型进行识别;对识别后结果进行汇总和结构化输出。本发明的有益效果是:该方法通过对低像素密度文本中含有特殊符号的文字区域进行判别,对特殊符号使用训练后模型进行识别从而提高特殊符号识别准确率,识别过程分多步骤进行,但涉及检测和再识别网络都比较小,可以有效提高识别效率。
技术领域
本发明属于图像识别技术领域,具体涉及一种低像素密度文本的识别方法。
背景技术
目前,在交易、贸易和企业间业务往来中会产生大量的纸质单据,如信用证、汇票、发票、合同、运输单据等。这些纸质单据往往需要录入到相应的业务系统中,这需要大量的人工和重复劳动,且效率低下容易出错。
OCR(Optical Character Recognition)技术是一种通过图像识别将图像中的文字转换成文本的技术。因此在处理各类单证票据场景下,OCR技术可以有效解决人工录入带来的问题。
常见的单证票据中,存在大量的特殊符号,诸如单选框、复选框、下划线以及条款约束脚注等,而目前市场上存在的OCR识别系统无法有效的处理和识别。由于这些区域像素密度比价低,常用的深度学习检测方法召回率比较低,易出现漏检现象;由于特殊符号出现的频率较低,且与汉字结构相似,通过扩充训练数据集进行迁移学习也很难达到较好的识别效果。
发明内容
本发明公开了一种低像素密度文本的识别方法,以解决现有技术的上述以及其他潜在问题中任一问题。
为了达到上述目的,本发明的技术方案是:一种低像素密度文本的识别方法,该方法的具体包括以下步骤:
S1)对待识别的低像素密度文本进行图像信息采集,并将采集的图像信息输入;
S2)对输入的图像信息进行预处理,并利用SIFT(Scale-Invariant featureTransform,SIFT即尺度不变特征变换)处理图像信息区域进行初步定位;
S3)根据S2)得到初步定位的结果再次进行精确定位;
S4)对S3)得到精确定位结果进行图像信息区域识别,并对识别后的结果进行分类,得到普通文本区域和特殊符号区域;
S5)将S4)得到普通文本区域和特殊符号区域分别输入特殊符号识别模型和普通文本识别模型进行识别;
S6)对识别后结果进行汇总和结构化输出。
所述低像素密度文本即包含大量的特殊符号,诸如单选框、复选框、下划线以及脚注等致使局部像素密度很低的文本识别。
进一步,所述S5)中还包括校正步骤:通过纠错校正机制,对识别的结果进行后期校正。
进一步,所述S2的具体步骤为:
S2.1)采用特征点匹配算法将输入的图像信息转化为矩阵,
S2.2)通过构建尺度空间和高斯空间差分金字塔,计算极值点和相应的坐标,
S2.3)根据S2.2)得到所有的极值点判别和定位特殊符号在图像信息中的大致坐标并提取对应的图像区域,完成初步定位。
进一步,所述S3)的具体步骤为:
S3.1)将经过S2.3)初步定位的结果输入CRAFT深度学习检测模型,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010190222.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:涨壳式新型注浆锚杆装置
- 下一篇:一种车辆管理的方法、装置、设备及存储介质





