[发明专利]一种适用于文本图像的图像对齐方法在审
申请号: | 202111170598.5 | 申请日: | 2021-10-08 |
公开(公告)号: | CN113947678A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 伊文超;朱利霞;李明明 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V30/148;G06V10/74;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜丽洁 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 文本 图像 对齐 方法 | ||
1.一种适用于文本图像的图像对齐方法,其特征在于,首先,字段特征提取,分别提取模板图和待对齐图中的字段特征,其次,同义字段对齐,计算模板图与待对齐图中两两字段特征之间的相似度,定位模板图和带对齐图的同名同含义字段,得到配对的字段对,最后,精确配对位置对齐及配对点优选,进而完成图像对齐。
2.根据权利要求1所述的一种适用于文本图像的图像对齐方法,其特征在于,在字段特征提取中,进一步包括:
S101、提取字段检测框在图像上的相对位置作为位置特征;
S102、提取字段中文本内容作为内容特征;
S103、提取字段邻域内文本框个数及内容作为领域特征。
3.根据权利要求2所述的一种适用于文本图像的图像对齐方法,其特征在于,完成图像位置特征、内容特征和领域特征构建后,则图像的字段特征记为:F={f1,f2,...,fn},fn表示图像中第一个字段的特征,fn={textpos,textrec,textnerb},获得模板图和待对齐的字段特征,分别记为:ftemp和feval。
4.根据权利要求2所述的一种适用于文本图像的图像对齐方法,其特征在于,在步骤S101中,文本框位置特征,记为textpos,由文本检测算法获取,通过文本检测算法,将获取图像中各个字段的文本包围框坐标;
进一步的将包围框坐标转换为相对位置,将图像分为四个区域,左上、右上、右下、左下,分别记为[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1],相对位置表示当前坐标框在图像中所处的位置。
5.根据权利要求2或4所述的一种适用于文本图像的图像对齐方法,其特征在于,在步骤S102中,文本框内容特征,记为textrec,由文本识别算法获取,其内容为文本框中的文字识别结果。
6.根据权利要求5所述的一种适用于文本图像的图像对齐方法,其特征在于,在步骤S103中,邻域信息,记为textnerb,计算当前文本框邻域内文本框的个数及其文字信息,邻域定义为两个字段文本框之间的像素点个数。
7.根据权利要求6所述的一种适用于文本图像的图像对齐方法,其特征在于,在同义字段对齐中,进一步包括:
S201、计算ftemp和feval的内容匹配度,取textrec特征,内容匹配度为模板图与待对齐图中textrec特征的重叠字符数/模板图textrec的字数;
如果相似度大于设定阈值,则进行下一步,代表该阈值可以控制字符识别算法所引入的误差;如果相似度等于1,则直接返回配对成功的字段对。
S202、对满足阈值的字段对,取textpos特征,计算位置相似度,其相似度度量空间采用欧式距离,如果相似度大于设定阈值,则进行下一步;如果相似度小于设定阈值,则跳过该字段对;
S203、对于满足阈值的字段对,取textnerb特征,计算邻域相似度,邻域相似度的计算方式为:重复字段数/模板邻域总字段数;
如果相似度大于设定阈值,则配对成功,记录该字段对;如果相似度小于设定阈值,则跳过该字段对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111170598.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序