[发明专利]基于分块统计的黑白文档影像降噪方法无效
申请号: | 200810063446.3 | 申请日: | 2008-08-05 |
公开(公告)号: | CN101345812A | 公开(公告)日: | 2009-01-14 |
发明(设计)人: | 陈纯;卜佳俊;杨智;王海杰;章辉 | 申请(专利权)人: | 浙江大学 |
主分类号: | H04N1/409 | 分类号: | H04N1/409 |
代理公司: | 杭州求是专利事务所有限公司 | 代理人: | 林怀禹 |
地址: | 310027浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分块 统计 黑白 文档 影像 方法 | ||
技术领域
本发明涉及针对扫描图像去噪处理的图像处理技术,特别是涉及一种基于分块统计的黑白文档影像降噪方法。
背景技术
图像降噪是指去除文档影像中的杂点,这些杂点有些是原始纸质文档本身就带有的,有些是扫描仪扫描过程中形成的。杂点的存在不仅影响到图像的美观,而且影像到OCR的文字识别率。噪声对图像处理十分重要,图像处理的输入、采集、处理的各个环节以及输出结果的全过程。手动消除图像杂点工作效率太低,所以必须实现计算机自动处理。降噪和保留细节是一个矛盾,降噪的同时也会丢失一部分细节,所以计算机自动去杂点需要避免的重要问题是伴随图像降噪而产生的图像质量的下降,比如图像有效信息的丢失。
减少噪声的方法可以在图像空间域或在图像变换域中完成。
“空间域”一词是指图像平面自身,在图像空间域中去噪是指在图像空间中,以对图像的像素直接处理为基础对图像进行各种处理。空间域处理可以由下式定义:g(x,y)=T(f(x,y)),其中f(x,y)是输入图像,g(x,y)是处理后的输出图像,T是对f的一种操作,其定义在(x,y)的邻域。定义一个点(x,y)邻域的主要方法是利用中心在(x,y)点的正方形或矩形子图像。图像空间域去噪方法很多,如:线性滤波法、中值滤波法、维纳滤波法等。
而图像变换域去噪方法是对图像进行某种变换,将图像从空间域转换到变换域,再对变换域中的变换系数进行处理,再进行反变换将图像从变换域转换到空间域来达到去除图像噪声的目的。将图像从空间转换到变换域的变换方法很多,如傅立叶变换、小波变换等。每种变换的变换域得到的系数都有不同的特点,合理地处理变换系数,再通过反变换将图像还原到空间域可以有效地达到去除噪声的目的。图像去噪存在一个如何兼顾降低图像噪声和保留细节的难题。传统的低通滤波方法在消除图像噪声的同时,也会消除图像部分有用的高频信息,所以传统的低通滤波方法在对保留图像细节的要求方面没有得到满意的效果。
发明内容
本发明的目的就是针对扫描文档影像杂点(噪声)的特点,基于分块统计的方法有效去除文档影像中的杂点,但不显著影响文档的图像质量。在以前对图像进行降噪处理时,往往采用滤波的方法,但是滤波的方法会使图像产生一定程度的模糊,降低了图像质量。本发明的目的在于提供一种基于分块统计的黑白文档影像降噪方法。
本发明采用的技术方案是:
(1)把文档影像划分成N×N的方块,N取值的大小取决于影像的每英寸像素数;
(2)考察每个方块A以及上下左右四个方块:
情况1:如果所考察的方块A中的点大于等于80%的黑色像素点数,认为这个方块A是文本区域的一部分,不予处理;
情况2:如果黑色像素点数小于80%,认为该方块A存在杂点,再统计所考察该方块A周围的方块,用同样的方法去考察该方块A上下左右四个方块是否为文本区域,还是空白区域,如果方块A周围的四个方块其中至少有一个是文本区域,那就判断该方块A内的小黑点是文档影像本身的黑点,不予处理,反之认为所考察的分块A中有杂点;
(3)如果判定所考察的方块A有杂点,就把该方块A内所有的像素改成白色,从而去除文档影像的杂点。
所述的步骤(2)中对所考察的方块A以及上下左右的方块,如果所考察的方块A内有小于80%的黑色像素并且它的四周都不是文本区域,那么就认为该方块中存在杂点,这个方法可以区分文档影像杂点和文字本身的像素点。
本发明具有的有益效果是:
本发明能够通过统计每个分块以及该分块四周分块的像素点的情况来判断该分块是否含有杂点(噪声)的方法来识别杂点并进一步去除杂点,最终达到在不显著影响文档影像图像质量的前提下很好地去除文档影像中的杂点。
本发明的实现大大减少了文档影像降噪处理的工作量,实现的方法简便,易于软件实现,可以实现运算复杂度与降噪效率之间的平衡。
具体实施方式
本发明提出的针对文档影像杂点特点的基于分块统计的降噪方法主要适用于各种不同的扫描文档影像。
在黑白文档影像中,黑点的值是0,白点的值是1。比如一个10×10像素点数的方块,如果是纯白的,没有杂点的,方块所有像素点的值的和是100,也就是说如果方块所有像素点的值的和是100,就认为这个方块是纯白的。方块内的小黑点可能是标点符号或字母上的小点,或者这个方块内的黑色像素点是四周方块内文字边上的一点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810063446.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:果皮中水溶性活性提取物及制备方法和用途
- 下一篇:液压破碎锤的性能测试系统