[发明专利]一种文本图像留白去除方法、装置、设备及存储介质在审
申请号: | 202111554301.5 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114240890A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 石朵伟;陈淑华 | 申请(专利权)人: | 深圳前海环融联易信息科技服务有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/136;G06T7/194;G06T5/00;G06V10/22 |
代理公司: | 深圳市精英创新知识产权代理有限公司 44740 | 代理人: | 林燕云 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 去除 方法 装置 设备 存储 介质 | ||
1.一种文本图像留白去除方法,其特征在于,包括:
对文本图像进行预处理,得到二值化图像;
对所述二值化图像进行开运算处理,得到仅包含文本特征的二值化图像;
遍历所述二值化图像中的行和列,统计每行和每列中的所有像素点;
在所述二值化图像中设定上起始点和下起始点,分别以所述上起始点和下起始点开始遍历每行中的像素点并找出对应的像素值突变点,并根据对应的像素值突变点计算出上留白位置和下留白位置;
在所述二值化图像中设定左起始点和右起始点,分别以所述左起始点和右起始点开始遍历每列中的像素点并找出对应的像素值突变点,并根据对应的像素值突变点计算出左留白位置和右留白位置;
根据得到的上留白位置、下留白位置、左留白位置以及右留白位置,对所述文本图像进行裁剪并得到留白去除的目标图像。
2.根据权利要求1所述的文本图像留白去除方法,其特征在于,所述对所述文本图像进行预处理,得到二值化图像,包括:
将所述文本图像转化为灰度图像,对所述灰度图像进行高斯平滑滤波处理;
对所述灰度图像进行二值化处理得到二值化图像;
根据预设的特征阈值,区分出所述二值化图像中的文本特征和背景特征。
3.根据权利要求1所述的文本图像留白去除方法,其特征在于,所述对所述二值化图像进行开运算处理后,得到仅包含文本特征的二值化图像,包括:
对所述二值化图像先进行腐蚀处理,再进行膨胀处理;
统计所述二值化图像中八连通区域的个数和每个八连通区域的区域面积;
根据预设的面积阈值,过滤区域面积小于设定面积阈值的八连通区域,得到仅包含文字特征的二值化图像,其中文字特征的像素点的像素值为255,背景特征的像素点的像素值为0。
4.根据权利要求1所述的文本图像留白去除方法,其特征在于,所述在所述二值化图像中设定上起始点和下起始点,分别以所述上起始点和下起始点开始遍历每行中的像素点并找出对应的像素值突变点,并根据对应的像素值突变点计算出上留白位置和下留白位置,包括:
在所述二值化图像中的高度方向上,以左上角为上起始点并按从上至下的方向遍历至第height//3行,其中height//3为所述二值化图像上的总行数除以3取整;
按如下上留白条件计算并得到第一候选上留白位置和第二候选上留白位置:
第一候选上留白位置为在满足h_white[i]=h_mean//2,且h_white[i]==0条件下的i的最大值,第二候选上留白位置为在满足h_white[i]=h_mean//2条件下的i的最大值,其中,h_white[i]为第i行的文本特征的像素点总数,h_mean//2为每行文本特征的像素点均值除以2取整,h_white[i]==0为第i行的像素点的像素值为0;
取所述第一候选上留白位置和第二候选上留白位置中的较小值作为上留白位置。
5.根据权利要求4所述的文本图像留白去除方法,其特征在于,所述在所述二值化图像中设定上起始点和下起始点,分别以所述上起始点和下起始点开始遍历每行中的像素点并找出对应的像素值突变点,并根据对应的像素值突变点计算出上留白位置和下留白位置,还包括:
在所述二值化图像中的高度方向上,以左下角为下起始点并按下至上的方向遍历至第2*height//3行,其中2*height//3为2倍的所述二值化图像上的总行数除以3取整;
按如下下留白条件计算并得到第一候选下留白位置和第二候选下留白位置:
第一候选下留白位置为满足h_white[i]=h_mean//2,且h_white[i]==0条件下的i的最小值,第二候选下留白位置为满足h_white[i]=h_mean//2条件下的i的最小值;
取所述第一候选下留白位置和第二候选下留白位置中的较大值作为下留白位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海环融联易信息科技服务有限公司,未经深圳前海环融联易信息科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111554301.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序