[发明专利]一种基于信号处理的文本图像行分割方法及其系统有效
| 申请号: | 201810893142.3 | 申请日: | 2018-08-07 |
| 公开(公告)号: | CN109117782B | 公开(公告)日: | 2020-07-14 |
| 发明(设计)人: | 李德健 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
| 代理公司: | 北京知元同创知识产权代理事务所(普通合伙) 11535 | 代理人: | 张祖萍;张田勇 |
| 地址: | 510530 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 信号 处理 文本 图像 分割 方法 及其 系统 | ||
1.一种基于信号处理的文本图像行分割方法,其特征在于,该方法包括:
步骤S101:对文本图像沿与文本图像中文本行书写方向相垂直的方向进行切割,分成多个子文本图像;
步骤S102:针对每个子文本图像,对该子文本图像的每一像素行的像素值进行求和,得到每一像素行的行像素求和值,该子文本图像的所有像素行的行像素求和值组成该子文本图像的行像素求和序列;
步骤S103:对每个子文本图像的行像素求和序列进行低通滤波;
步骤S104:对低通滤波后的每个子文本图像的行像素求和序列进行带通滤波;
步骤S105:计算带通滤波后的每个子文本图像的行像素求和序列的局部极大值,得到每个子文本图像的行像素求和序列的局部极大值集合;
步骤S106:对每个子文本图像的行像素求和序列的局部极大值集合中的局部极大值进行过滤,去除由噪声引起的行像素求和序列的局部极大值;
步骤S107:按照距离最近的原则,从文本图像中文本行书写方向的第一个子文本图像开始,依次连接过滤后的沿文本图像中文本行书写方向的相邻子文本图像的局部极大值所对应的像素点,得到整幅文本图像的文本行方向线;
步骤S108:计算相邻两个文本行方向线之间的文本图像梯度,根据梯度最小值,确定相邻两个文本行之间的分割线。
2.根据权利要求1所述的方法,其特征在于,所述步骤S106中的所述对每个子文本图像的行像素求和序列的局部极大值集合中的局部极大值进行过滤的方法,包括以下步骤:
首先,计算每个局部极大值左边距离最近的局部极小值和右边距离最近的局部极小值;
其次,计算左边距离最近的局部极小值与该局部极大值的差值,以及计算右边距离最近的局部极小值与该局部极大值的差值,当这两个差值的绝对值均小于预设值时,将该局部极大值滤除。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
步骤S109:根据步骤S108确定的分割线,分割出每个文本行的子图像,统计分割出的所有文本行的子图像的行高的中值,将每个文本行的子图像的行高与统计的中值进行比较,如果某一个文本行的子图像的行高远大于或远小于统计的中值,则将该文本行剔除。
4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
步骤S110:根据步骤S108确定的分割线,分割出每个文本行的子图像,对每个文本行的子图像的每一行像素的像素值进行求和,得到一个求和序列,统计该求和序列中大于设定阈值的元素的数目,如果该数目小于设定值,则将该文本行剔除。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
步骤S109:根据步骤S108确定的分割线,分割出每个文本行的子图像,统计分割出的所有文本行的子图像的行高的中值,将每个文本行的子图像的行高与统计的中值进行比较,如果某一个文本行的子图像的行高远大于或远小于统计的中值,则将该文本行剔除;
步骤S110:对剩余的每个文本行的子图像的每一行像素的像素值进行求和,得到一个求和序列,统计该求和序列中大于设定阈值的元素的数目,如果该数目小于设定值,则将该文本行剔除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810893142.3/1.html,转载请声明来源钻瓜专利网。





