[发明专利]一种适用于文本图像的图像对齐方法在审
申请号: | 202111170598.5 | 申请日: | 2021-10-08 |
公开(公告)号: | CN113947678A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 伊文超;朱利霞;李明明 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V30/148;G06V10/74;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜丽洁 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 文本 图像 对齐 方法 | ||
本发明涉及图像处理技术领域,具体提供了一种适用于文本图像的图像对齐方法,首先,字段特征提取,分别提取模板图和待对齐图中的字段特征,其次,同义字段对齐,计算模板图与待对齐图中两两字段特征之间的相似度,定位模板图和带对齐图的同名同含义字段,得到配对的字段对,最后,精确配对位置对齐及配对点优选,进而完成图像对齐。与现有技术相比,本发明的基于字符特征进行关键点提取,相对于传统sift特征,其维度更丰富且具有实际意义,对图像的拍摄环境受限较小,模板图和待对齐图存在拍摄环境差异和畸变情况,仍能保持较好的准确性。
技术领域
本发明涉及图像处理技术领域,具体提供一种适用于文本图像的图像对齐方法。
背景技术
随着信息技术的普及,数字办公成为必然,数字信息具备的便捷、共享和快速检索的优势越来越显著。在日常生产工作中,海量的票据、文档等被积累下来,其中包括大量的图片数据,有效的对这些图片数据进行自动化的内容提取、结构化和入库归档,成为业界的诉求。
目前对于票据等具备特定格式的图像内容提取多基于模板和文字识别(OCR技术)的方式进行处理,此种方式依赖于准确的图像对齐技术,即:将待解析图像与模板图像进行对应位置对准,传统的对齐方式多基于特征点的方式,在实际应用中,手机拍摄的图像受拍摄环境的影响,存在着畸变、扭曲等问题,致使配对的特征点存在误差,难以得到理想的对齐效果。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的适用于文本图像的图像对齐方法。
本发明解决其技术问题所采用的技术方案是:
一种适用于文本图像的图像对齐方法,首先,字段特征提取,分别提取模板图和待对齐图中的字段特征,其次,同义字段对齐,计算模板图与待对齐图中两两字段特征之间的相似度,定位模板图和带对齐图的同名同含义字段,得到配对的字段对,最后,精确配对位置对齐及配对点优选,进而完成图像对齐。
进一步的,在字段特征提取中,进一步包括:
S101、提取字段检测框在图像上的相对位置作为位置特征;
S102、提取字段中文本内容作为内容特征;
S103、提取字段邻域内文本框个数及内容作为领域特征。
进一步的,完成图像位置特征、内容特征和领域特征构建后,则图像的字段特征记为:F={f1,f2,...,fn},fn表示图像中第一个字段的特征,fn={textpos,textrec,textnerb},获得模板图和待对齐的字段特征,分别记为:ftemp和feval。
进一步的,在步骤S101中,文本框位置特征,记为textpos,由文本检测算法获取,通过文本检测算法,将获取图像中各个字段的文本包围框坐标;
将包围框坐标转换为相对位置,将图像分为四个区域,左上、右上、右下、左下,分别记为[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1],相对位置表示当前坐标框在图像中所处的位置。
进一步的,在步骤S102中,文本框内容特征,记为textrec,由文本识别算法获取,其内容为文本框中的文字识别结果。
进一步的,在步骤S103中,邻域信息,记为textnerb,计算当前文本框邻域内文本框的个数及其文字信息,邻域定义为两个字段文本框之间的像素点个数。
进一步的,在同义字段对齐中,进一步包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111170598.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序