[发明专利]文档图像处理方法、文档图像处理装置及存储介质有效
申请号: | 201810294456.1 | 申请日: | 2018-03-30 |
公开(公告)号: | CN110321887B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 李娇凤;罗兆海 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/40 |
代理公司: | 北京怡丰知识产权代理有限公司 11293 | 代理人: | 迟军;李艳丽 |
地址: | 日本国东京都*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 处理 方法 装置 存储 介质 | ||
1.一种文档图像处理方法,所述文档图像中包括与线接触的文本行,所述文档图像处理方法包括:
将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;
根据子区域中包含的字符和与字符接触的线的方向和长度来确定该子区域的文本方向;
基于确定出的子区域的文本方向确定位于各相邻字符之间的、不与字符接触的线;
基于确定出的子区域的文本方向与位于相邻字符空白间隔的、不与字符接触的线,确定与待处理文本行中的文本行接触的线。
2.根据权利要求1所述的文档图像处理方法,其中,该方法还包括:
对所述文档图像执行预处理,并从中确定出待处理文本行。
3.根据权利要求1所述的文档图像处理方法,其中,该方法还包括:
去除确定出的线。
4.根据权利要求1至3任一所述的文档图像处理方法,其中,所述文档图像为非线性变形的图像、线性变形的图像或没有变形的图像。
5.根据权利要求1所述的文档图像处理方法,其中,将待处理文本行划分为多个子区域具体包括:
确定待处理文本行中同一像素列上的顶部像素和底部像素之间的距离;
过滤顶部像素和底部像素之间的距离满足设定条件的像素列;
基于过滤后的像素列中的顶部像素和底部像素之间的距离来确定子区域的尺寸参数;
从待处理文本行中的像素列中选择多个像素列的中心点作为子区域的中心;
基于确定的子区域的尺寸参数和子区域的中心划分出多个子区域。
6.根据权利要求1所述的文档图像处理方法,其中,将待处理文本行划分为多个子区域具体包括:
确定待处理文本行中各像素列中前景像素的数量;
确定像素列组,该像素列组中的各像素列是相邻像素列,且每个像素列中的前景像素的数量小于第一数量;
确定相邻的像素列组之间存在前景像素的数量大于第二数量的像素列的多个像素列组,从确定出的每个像素列组中确定一个像素列作为子区域的左右边界;
将左右边界之间的有前景像素的第一像素行和最后一像素行作为上下边界;
基于确定出的左右边界和上下边界划分出子区域。
7.根据权利要求1所述的文档图像处理方法,其中,确定子区域的文本方向具体包括:
提取子区域中的线段,并确定每条线段的方向和长度;
为各方向设置权重,其中,对应线段越长的方向设置的权重越大;
基于各方向的权重值来确定子区域的文本方向。
8.根据权利要求1所述的文档图像处理方法,其中,确定子区域的文本方向具体包括:
提取子区域中的长度达到设定阈值的线段;
过滤掉提取的线段中的属于字符笔划的线段;
基于剩余的线段的方向来估计子区域中的文本方向。
9.根据权利要求1所述的文档图像处理方法,其中,确定待处理文本行中与文本行接触的线具体包括:
针对每个子区域,将该子区域中的各像素列沿该子区域的文本方向进行投影,得到各像素列中的前景像素的数量;
基于投影结果确定位于各相邻字符之间的、不与字符接触的线;
基于位于相邻字符空白间隔的、不与字符接触的线,确定与待处理文本行中的文本行接触的完整的线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810294456.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序