[发明专利]一种基于文档图像自动去除黑边的方法在审

专利信息
申请号: 201710777958.5 申请日: 2017-09-01
公开(公告)号: CN107516085A 公开(公告)日: 2017-12-26
发明(设计)人: 孙鑫;王长征;刘文晓;赵胜男 申请(专利权)人: 山西同方知网数字出版技术有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06T5/00
代理公司: 北京天奇智新知识产权代理有限公司11340 代理人: 李振文
地址: 030006 山西省太*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 文档 图像 自动 去除 方法
【说明书】:

技术领域

本发明涉及图像识别和图像处理的技术领域,尤其涉及一种基于文档图像的缺陷检测、缺陷识别、自动去除及去除后效果评估的方法。

背景技术

在文档高速扫描的过程中,图像边缘会出现一些不规则的黑边(黑边是指扫描图像的黑色边缘),黑边会对图像的视觉效果、信息读取和版面分析等方面造成影响,从而影响用户的正常使用。在数字出版、图书馆管理、档案管理、企业内部资料管理系统中,此类问题尤为突出。因此,去除黑边对改善视觉效果以及提高识别率等方面有着非常重要的作用。

发明内容

为解决上述技术问题,本发明的目的是提供一种基于文档图像自动去除黑边的方法,该方法能自动检测、识别、自动去除黑边,并对去除后的效果作出评估。

本发明的目的通过以下的技术方案来实现:

一种基于文档图像自动去除黑边的方法,包括:

A对文档图像进行预处理;

B检测文档图像中的缺陷;

C根据文档图像缺陷检测结果,判断并识别缺陷种类,包括图像黑边、版面位置;

D去除文档图像黑边;

E根据文档图像黑边去除结果,判断并给出黑边去除置信度。

与现有技术相比,本发明的一个或多个实施例可以具有如下优点:

可以达到自动去黑边的功能,同时给出结果置信度判断;原来的算法有将文字删除掉,或是黑边去除不干净等问题,本发明解决了多去除或去除不净的问题;原来的算法没有对去除结果做评估,本发明给出结果置信度判断,对去黑边效果作出评估。

附图说明

图1是基于文档图像自动去除黑边的方法流程图;

图2是结果置信度评估属A类的去黑边前后对比图;

图3是结果置信度评估属E类的去黑边前后对比图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本发明作进一步详细的描述。

如图1所示,为基于文档图像自动去除黑边的方法,包括以下步骤:

步骤10对文档图像进行预处理;

步骤20检测文档图像中的缺陷;

步骤30根据文档图像缺陷检测结果,判断并识别缺陷种类,包括图像黑边、版面位置;

步骤40去除文档图像黑边;

步骤50根据文档图像黑边去除结果,判断并给出黑边去除置信度。

上述步骤10对文档图像的预处理包括纠偏、版心居中和二值化。

上述步骤20具体包括:深度优先遍历图像,自动搜索缺陷的连通区域。

上述步骤30中黑边缺陷判断包括:

用一定尺寸的模板判断某个缺陷区域是否属于黑边区域,假定当前判断模板的大小为M×N,k是其中的白色像素数,σ是一个比较小的阈值,计算模板内白色像素的密度k/(M×N),当k/(M×N)<σ时,判断该缺陷为黑边。

黑边的宽高比具有随机性,但为了放置误删页眉线、表格线等有用信息,需将宽与高的比值设定为小于ε。

缺陷种类识别中,版面位置也很重要。根据版面分析,判断缺陷所在位置是否属于文字区域以外的版面。

上述步骤50根据去除黑边的效果,对处理后的文档图像做版面分析,确定文档内容(包括文字与非文字)区域,对文档内容区域外的部分做投影,根据投影结果,分析是否属于未去除干净的黑块黑边,给予评估,做出置信度判断,分为去除后完全正确的A类(如图2所示),疑似有未去除干净的E类(如图3所示)。

上述实施例可以通过缺陷检测、识别,自动全面地将图像中的黑边去掉,达到了自动化处理要求,并根据结果分析去黑边的效果,分析其置信度。将黑边完全去除的页面设为置信度A,将黑边以外无法去除的黑块、打印孔及未去除干净的页面设为置信度E,这样提高了工作效率,增加了结果的准确性。

虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西同方知网数字出版技术有限公司,未经山西同方知网数字出版技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710777958.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top