[发明专利]一种古籍文档图像污渍去除方法有效

专利信息
申请号: 201710748787.3 申请日: 2017-08-28
公开(公告)号: CN107610132B 公开(公告)日: 2021-12-31
发明(设计)人: 王维兰;韩跃辉;王轶群 申请(专利权)人: 西北民族大学
主分类号: G06T7/11 分类号: G06T7/11;G06T5/50
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 汤东凤
地址: 730030 甘*** 国省代码: 甘肃;62
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 古籍 文档 图像 污渍 去除 方法
【说明书】:

发明公开了一种古籍文档图像污渍去除方法,该方法将待处理图像由RGB颜色空间转换到Lab颜色空间,利用Lab颜色空间的三个通道图像对其进行分离,利用分离后不同通道图像的自身信息,选择L通道和b通道进行融合从而减弱或消除污渍的影响;根据消除污渍后图像里文字的数量及大小自动确定图像文本分块的大小,判断分块后的图像是否需要延扩;对图像分块进行全局和局部相结合的二值化处理,得到二值图像。本发明将Lab颜色空间的三个通道图像分离后进行两种通道的融合,解决了古籍文本图像中的污渍去除问题;二值化处理的过程中,采用图像自动分块的方法,将全局和局部相结合,能有效去除古籍文档图像中的污渍,且二值化效果好。

技术领域

本发明属于文档分析与识别技术领域,尤其涉及一种古籍文档图像污渍去除方法。

背景技术

文档图像修复中常会用到图像二值化,图像二值化可以分为灰度图像二值化和彩色图像二值化,灰度图像的二值化都是基于阈值的方法,进而得到图像二值化的结果,因此阈值的选取对图像二值化结果有着决定性的作用。由于年代久远,很多古籍页面存在污渍,如何去除污渍、获得有效的藏文古籍二值图像,进而进行文档的行字切分和字符识别是一个重要的环节。

目前基于阈值的二值化方法又可以分为全局阈值法和局部阈值法,全局阈值法对整幅图像采用单一阈值,以所有像素值与其相比的结果判断目标与背景,其中广泛应用的一种算法为N.Otsu提出的Otsu算法(参见N.Otsu.A threshold selection method fromgray-level histogram[J].IEEE Trans.SMC,1979,(1):62-66),此种算法具有较强的自适应性,不过对于一些背景灰度变化较大、光照不均匀、存在污渍的复杂背景图像,应用Otsu算法只能获得单一的阈值,并不能对图像的各个区域实际情况进行兼顾,所以无法实现图像的有效分割(参见张一凡,康雁,林英.局部动态阈值图像分割算法研究[J].软件导刊,2013,(12):46-48)。

为了解决全局阈值法存在的问题,一些学者提出了局部阈值法。局部阈值法不再使用单一的全局阈值,而是将每个点与其局部邻域的其他像素点进行对比,根据局部特性确定每个像素点的阈值,然后进行二值化处理。典型的局部二值化算法有Bernsen法(参见AMA Talab,Z Huang,J Wang.An enhanced Bernsen algorithm approaches for vehiclelogo detection[J].International Journal of Signal Processing,Image Processingand Pattern Recognition,2014,(7):203-210)、Niblack法(参见王序哲.局部自适应二值化方法研究[J].软件导刊,2011,(10):13-14)、Sauvola法(参见J.Sauvola,M.PietikaKainen.Adaptive document image binarization[J].Pattern Recognition,1999,(1):225-236)等,其中Sauvola算法通过增加标准偏差的动态范围、局部像素值的均值及局部方差相乘而非相加来增大局部方差的影响;Niblack算法对经验参数敏感,二值化结果带有椒盐噪声的缺点进行了改进,但采用Niblack方法对有污渍的文档图像处理时,二值化后的图像噪声严重,文字更加模糊不清,污渍不能去除;采用Sauvola方法对有污渍的文档图像处理时,虽能得到清晰的文字图像,但污渍仍不能彻底清除。故而对于光照不均、低对比度的图像,使用局部阈值法能够得到更好的二值化效果,但是对于存在污渍的图像该方法不可避免的会导致虚假目标的存在。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北民族大学,未经西北民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710748787.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top