[发明专利]一种适用于文本图像的图像对齐方法在审

专利信息
申请号: 202111170598.5 申请日: 2021-10-08
公开(公告)号: CN113947678A 公开(公告)日: 2022-01-18
发明(设计)人: 伊文超;朱利霞;李明明 申请(专利权)人: 浪潮云信息技术股份公司
主分类号: G06V10/25 分类号: G06V10/25;G06V30/148;G06V10/74;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司: 济南信达专利事务所有限公司 37100 代理人: 姜丽洁
地址: 250100 山东省济南市高*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 适用于 文本 图像 对齐 方法
【说明书】:

发明涉及图像处理技术领域,具体提供了一种适用于文本图像的图像对齐方法,首先,字段特征提取,分别提取模板图和待对齐图中的字段特征,其次,同义字段对齐,计算模板图与待对齐图中两两字段特征之间的相似度,定位模板图和带对齐图的同名同含义字段,得到配对的字段对,最后,精确配对位置对齐及配对点优选,进而完成图像对齐。与现有技术相比,本发明的基于字符特征进行关键点提取,相对于传统sift特征,其维度更丰富且具有实际意义,对图像的拍摄环境受限较小,模板图和待对齐图存在拍摄环境差异和畸变情况,仍能保持较好的准确性。

技术领域

本发明涉及图像处理技术领域,具体提供一种适用于文本图像的图像对齐方法。

背景技术

随着信息技术的普及,数字办公成为必然,数字信息具备的便捷、共享和快速检索的优势越来越显著。在日常生产工作中,海量的票据、文档等被积累下来,其中包括大量的图片数据,有效的对这些图片数据进行自动化的内容提取、结构化和入库归档,成为业界的诉求。

目前对于票据等具备特定格式的图像内容提取多基于模板和文字识别(OCR技术)的方式进行处理,此种方式依赖于准确的图像对齐技术,即:将待解析图像与模板图像进行对应位置对准,传统的对齐方式多基于特征点的方式,在实际应用中,手机拍摄的图像受拍摄环境的影响,存在着畸变、扭曲等问题,致使配对的特征点存在误差,难以得到理想的对齐效果。

发明内容

本发明是针对上述现有技术的不足,提供一种实用性强的适用于文本图像的图像对齐方法。

本发明解决其技术问题所采用的技术方案是:

一种适用于文本图像的图像对齐方法,首先,字段特征提取,分别提取模板图和待对齐图中的字段特征,其次,同义字段对齐,计算模板图与待对齐图中两两字段特征之间的相似度,定位模板图和带对齐图的同名同含义字段,得到配对的字段对,最后,精确配对位置对齐及配对点优选,进而完成图像对齐。

进一步的,在字段特征提取中,进一步包括:

S101、提取字段检测框在图像上的相对位置作为位置特征;

S102、提取字段中文本内容作为内容特征;

S103、提取字段邻域内文本框个数及内容作为领域特征。

进一步的,完成图像位置特征、内容特征和领域特征构建后,则图像的字段特征记为:F={f1,f2,...,fn},fn表示图像中第一个字段的特征,fn={textpos,textrec,textnerb},获得模板图和待对齐的字段特征,分别记为:ftemp和feval

进一步的,在步骤S101中,文本框位置特征,记为textpos,由文本检测算法获取,通过文本检测算法,将获取图像中各个字段的文本包围框坐标;

将包围框坐标转换为相对位置,将图像分为四个区域,左上、右上、右下、左下,分别记为[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1],相对位置表示当前坐标框在图像中所处的位置。

进一步的,在步骤S102中,文本框内容特征,记为textrec,由文本识别算法获取,其内容为文本框中的文字识别结果。

进一步的,在步骤S103中,邻域信息,记为textnerb,计算当前文本框邻域内文本框的个数及其文字信息,邻域定义为两个字段文本框之间的像素点个数。

进一步的,在同义字段对齐中,进一步包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111170598.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top