[发明专利]模糊文档图像的二值化方法及其设备有效

专利信息
申请号: 200910009924.7 申请日: 2009-01-22
公开(公告)号: CN101789081A 公开(公告)日: 2010-07-28
发明(设计)人: 姜涌;王晓莉 申请(专利权)人: 佳能株式会社
主分类号: G06K9/36 分类号: G06K9/36
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 康建忠
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模糊 文档 图像 二值化 方法 及其 设备
【说明书】:

技术领域

发明涉及二值化处理领域,更具体地,涉及模糊文档图像的二 值化方法及其设备。

背景技术

在许多文档处理系统中,灰度文档图像(彩色文档图像可以被转 换成灰度文档图像)首先被二值化,以形成二值(黑/白)图像。如名 称为“Evaluation of Binarization Methods for Document Images”(D. Trier和T.Taxt,IEEE Transactions on Pattern Analysis and Machine Intelligence,Vol.17,No.3,1995年3月)的文章所公开的那样,对于 光学字符识别(OCR)而言,合适的二值化方法对于保留诸如字符笔 画的有关子要素是很有用的。二值化处理涉及将像素分配给前景或背 景目标。通常通过全局或局部阈值方案来实现所述处理。全局和局部 阈值方案都利用这一假设:能通过将前景和背景像素的强度值与一些 规定的或自动选择的阈值相比较来划分所述前景和背景像素(参见J. Sauvola,S.Haapakoski,“Adaptive Document Binarization”,IEEE Proceedings of the Fourth International Conference on Document Analysis and Recognition,Vol.1.pp147-152,1997)。

对于由数字照相机拍摄的文档图像,由于失焦,所以通常存在模 糊文本区域。如果模糊文档图像被直接地二值化,则通常不能辨别所 得的二值图像的字符笔画,这将导致低OCR识别率。图1示出通过 使用不同的二值化方法对于一些模糊文档图像的二值化结果(参见N. Otsu,“A Threshold Selection Method from Gray Level”,IEEE Transactions on System.Man.and Cybernetics,Vol.9,No.1,pp62-66, 1979;J.Kittler,J.Illingworth,“Minimum Error Thresholding”, Pattern Recognition,19(1),pp41-47,1986;W.Niblack,“An Introduction to Digital Image Processing”,pp115-116,Prentice Hall, 1986)。

为了识别模糊文档图像上的更多字符,非常需要去模糊处理。其 能使模糊文档图像中的字符更加清楚。然而,同时,在去模糊处理之 后,会或多或少带来振铃伪影(ring artifact)。如果去模糊图像被直 接地二值化,则这些振铃伪影将在所得的二值图像上导致许多噪声, 这也将导致低OCR识别率。图2示出一些去模糊图像和它们相应的 二值化结果。

因此,需要一种技术,其能从模糊文档图像得到清晰二值图像, 且其有效并易于实施。本发明所提出的方法和设备对于解决这一问题 是有效的。

发明内容

本发明的目的是提供一种模糊文档图像的二值化方法及其设备。

本发明的另一目的是提供一种模糊文档图像的二值化方法及其设 备,其中,能从模糊文档图像获得清晰二值图像,且因此与通常的二 值化方法相比,所得的二值图像能被OCR引擎更好地识别。

根据本发明的第一方面,提供一种模糊文档图像的二值化方法, 包括:去模糊步骤,用于从所述模糊文档图像生成去模糊图像;第一 个二值化步骤,用于从所述模糊文档图像生成第一个二值图像;以及 第二个二值化步骤,用于通过使用所述第一个二值图像和所述去模糊 图像的组合进行二值化而生成第二个二值图像。

所述第二个二值化步骤将所述去模糊图像的位置对应于所述第一 个二值图像中的前景颜色位置的点二值化,其中,所述前景颜色位置 对应于所述第一个二值图像中的前景像素的位置。

根据本发明的示例性实施例,所述第二个二值化步骤可包括:选 点步骤,用于在所述去模糊图像中选择位置对应于所述第一个二值图 像中的前景颜色位置的点,其中所述前景颜色位置对应于所述第一个 二值图像中的前景像素的位置;以及点到点二值化步骤,用于将所述 选点步骤中所选择的每一点二值化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910009924.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top