[发明专利]一种文本图像留白去除方法、装置、设备及存储介质在审

专利信息
申请号: 202111554301.5 申请日: 2021-12-17
公开(公告)号: CN114240890A 公开(公告)日: 2022-03-25
发明(设计)人: 石朵伟;陈淑华 申请(专利权)人: 深圳前海环融联易信息科技服务有限公司
主分类号: G06T7/00 分类号: G06T7/00;G06T7/136;G06T7/194;G06T5/00;G06V10/22
代理公司: 深圳市精英创新知识产权代理有限公司 44740 代理人: 林燕云
地址: 518000 广东省深圳市前海深港合作区前*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 图像 去除 方法 装置 设备 存储 介质
【权利要求书】:

1.一种文本图像留白去除方法,其特征在于,包括:

对文本图像进行预处理,得到二值化图像;

对所述二值化图像进行开运算处理,得到仅包含文本特征的二值化图像;

遍历所述二值化图像中的行和列,统计每行和每列中的所有像素点;

在所述二值化图像中设定上起始点和下起始点,分别以所述上起始点和下起始点开始遍历每行中的像素点并找出对应的像素值突变点,并根据对应的像素值突变点计算出上留白位置和下留白位置;

在所述二值化图像中设定左起始点和右起始点,分别以所述左起始点和右起始点开始遍历每列中的像素点并找出对应的像素值突变点,并根据对应的像素值突变点计算出左留白位置和右留白位置;

根据得到的上留白位置、下留白位置、左留白位置以及右留白位置,对所述文本图像进行裁剪并得到留白去除的目标图像。

2.根据权利要求1所述的文本图像留白去除方法,其特征在于,所述对所述文本图像进行预处理,得到二值化图像,包括:

将所述文本图像转化为灰度图像,对所述灰度图像进行高斯平滑滤波处理;

对所述灰度图像进行二值化处理得到二值化图像;

根据预设的特征阈值,区分出所述二值化图像中的文本特征和背景特征。

3.根据权利要求1所述的文本图像留白去除方法,其特征在于,所述对所述二值化图像进行开运算处理后,得到仅包含文本特征的二值化图像,包括:

对所述二值化图像先进行腐蚀处理,再进行膨胀处理;

统计所述二值化图像中八连通区域的个数和每个八连通区域的区域面积;

根据预设的面积阈值,过滤区域面积小于设定面积阈值的八连通区域,得到仅包含文字特征的二值化图像,其中文字特征的像素点的像素值为255,背景特征的像素点的像素值为0。

4.根据权利要求1所述的文本图像留白去除方法,其特征在于,所述在所述二值化图像中设定上起始点和下起始点,分别以所述上起始点和下起始点开始遍历每行中的像素点并找出对应的像素值突变点,并根据对应的像素值突变点计算出上留白位置和下留白位置,包括:

在所述二值化图像中的高度方向上,以左上角为上起始点并按从上至下的方向遍历至第height//3行,其中height//3为所述二值化图像上的总行数除以3取整;

按如下上留白条件计算并得到第一候选上留白位置和第二候选上留白位置:

第一候选上留白位置为在满足h_white[i]=h_mean//2,且h_white[i]==0条件下的i的最大值,第二候选上留白位置为在满足h_white[i]=h_mean//2条件下的i的最大值,其中,h_white[i]为第i行的文本特征的像素点总数,h_mean//2为每行文本特征的像素点均值除以2取整,h_white[i]==0为第i行的像素点的像素值为0;

取所述第一候选上留白位置和第二候选上留白位置中的较小值作为上留白位置。

5.根据权利要求4所述的文本图像留白去除方法,其特征在于,所述在所述二值化图像中设定上起始点和下起始点,分别以所述上起始点和下起始点开始遍历每行中的像素点并找出对应的像素值突变点,并根据对应的像素值突变点计算出上留白位置和下留白位置,还包括:

在所述二值化图像中的高度方向上,以左下角为下起始点并按下至上的方向遍历至第2*height//3行,其中2*height//3为2倍的所述二值化图像上的总行数除以3取整;

按如下下留白条件计算并得到第一候选下留白位置和第二候选下留白位置:

第一候选下留白位置为满足h_white[i]=h_mean//2,且h_white[i]==0条件下的i的最小值,第二候选下留白位置为满足h_white[i]=h_mean//2条件下的i的最小值;

取所述第一候选下留白位置和第二候选下留白位置中的较大值作为下留白位置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海环融联易信息科技服务有限公司,未经深圳前海环融联易信息科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111554301.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top