[发明专利]一种低像素密度文本的识别方法有效

专利信息
申请号: 202010190222.X 申请日: 2020-03-18
公开(公告)号: CN111414917B 公开(公告)日: 2023-05-12
发明(设计)人: 李振;鲁宾宾;刘挺;陈伟强;陈远琴;孟天祥;翟昶 申请(专利权)人: 民生科技有限责任公司
主分类号: G06V30/148 分类号: G06V30/148;G06V30/14;G06V30/18;G06N3/0464;G06N3/08
代理公司: 北京金智普华知识产权代理有限公司 11401 代理人: 巴晓艳
地址: 101300 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 像素 密度 文本 识别 方法
【说明书】:

发明属于图像识别技术领域,涉及一种低像素密度文本的识别方法。该方法的具体步骤为:对待识别的低像素密度文本进行图像信息采集,并将采集的图像信息输入并进行预处理,进行初步定位;再次进行精确定位;根据得到精确定位结果进行图像信息区域识别,并对识别后的结果进行分类,将分类数据分别输入特殊符号识别模型和普通文本识别模型进行识别;对识别后结果进行汇总和结构化输出。本发明的有益效果是:该方法通过对低像素密度文本中含有特殊符号的文字区域进行判别,对特殊符号使用训练后模型进行识别从而提高特殊符号识别准确率,识别过程分多步骤进行,但涉及检测和再识别网络都比较小,可以有效提高识别效率。

技术领域

本发明属于图像识别技术领域,具体涉及一种低像素密度文本的识别方法。

背景技术

目前,在交易、贸易和企业间业务往来中会产生大量的纸质单据,如信用证、汇票、发票、合同、运输单据等。这些纸质单据往往需要录入到相应的业务系统中,这需要大量的人工和重复劳动,且效率低下容易出错。

OCR(Optical Character Recognition)技术是一种通过图像识别将图像中的文字转换成文本的技术。因此在处理各类单证票据场景下,OCR技术可以有效解决人工录入带来的问题。

常见的单证票据中,存在大量的特殊符号,诸如单选框、复选框、下划线以及条款约束脚注等,而目前市场上存在的OCR识别系统无法有效的处理和识别。由于这些区域像素密度比价低,常用的深度学习检测方法召回率比较低,易出现漏检现象;由于特殊符号出现的频率较低,且与汉字结构相似,通过扩充训练数据集进行迁移学习也很难达到较好的识别效果。

发明内容

本发明公开了一种低像素密度文本的识别方法,以解决现有技术的上述以及其他潜在问题中任一问题。

为了达到上述目的,本发明的技术方案是:一种低像素密度文本的识别方法,该方法的具体包括以下步骤:

S1)对待识别的低像素密度文本进行图像信息采集,并将采集的图像信息输入;

S2)对输入的图像信息进行预处理,并利用SIFT(Scale-Invariant featureTransform,SIFT即尺度不变特征变换)处理图像信息区域进行初步定位;

S3)根据S2)得到初步定位的结果再次进行精确定位;

S4)对S3)得到精确定位结果进行图像信息区域识别,并对识别后的结果进行分类,得到普通文本区域和特殊符号区域;

S5)将S4)得到普通文本区域和特殊符号区域分别输入特殊符号识别模型和普通文本识别模型进行识别;

S6)对识别后结果进行汇总和结构化输出。

所述低像素密度文本即包含大量的特殊符号,诸如单选框、复选框、下划线以及脚注等致使局部像素密度很低的文本识别。

进一步,所述S5)中还包括校正步骤:通过纠错校正机制,对识别的结果进行后期校正。

进一步,所述S2的具体步骤为:

S2.1)采用特征点匹配算法将输入的图像信息转化为矩阵,

S2.2)通过构建尺度空间和高斯空间差分金字塔,计算极值点和相应的坐标,

S2.3)根据S2.2)得到所有的极值点判别和定位特殊符号在图像信息中的大致坐标并提取对应的图像区域,完成初步定位。

进一步,所述S3)的具体步骤为:

S3.1)将经过S2.3)初步定位的结果输入CRAFT深度学习检测模型,

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010190222.X/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top