[发明专利]用于从数字图像中去除噪声的方法和装置有效

专利信息
申请号: 200680045042.0 申请日: 2006-11-28
公开(公告)号: CN101322154A 公开(公告)日: 2008-12-10
发明(设计)人: D·G·尼科尔森 申请(专利权)人: 奥多比公司
主分类号: G06T5/00 分类号: G06T5/00
代理公司: 北京市金杜律师事务所 代理人: 朱海波
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 数字图像 去除 噪声 方法 装置
【说明书】:

技术领域

发明涉及图像处理。更具体地,本发明涉及用于促进从数字图像去除噪声的方法和装置。

背景技术

随着企业和其他组织进一步的计算机化,在计算机系统上存储和维护纸质文档的电子版本变得越来越普遍。在计算机系统上存储纸质文档的处理通常包括“文档成像”处理,所述处理将纸质文档的副本转换成为电子文档。此文档成像处理通常开始于成像步骤,其中使用扫描仪、复印机、照相机或者其他成像设备来生成文档的页面图像。在集合到诸如便携文档格式(PDF)文件的文档容器中之前,通常使用程序处理程序来分析和增强这些页面图像。

通常,应用需要从所扫描的页面图像识别文本以促进后续的文档处理操作。这通常通过光学字符识别(OCR)处理来完成。

遗憾的是,在所扫描图像中,噪声的出现将使得OCR处理的性能显著降级,这是非常普遍的。从打印和成像处理中,将产生各种类型的噪声以及类噪声伪像(artifact)。噪声以及类噪声伪像可以包括来自成像光传感器的量化噪声、成像设备光学器件上的污物、飞溅的墨迹以及着色剂污迹。

由于此问题,通常在OCR处理之前对图像应用噪声去除操作。例如,普通的噪声去除操作去除小于像素数阈值的所有斑点(blob)。然而,这可能导致去除诸如“句号”的小字符,或者可能导致残留下相当大的噪声伪像。几乎不存在针对所有字符尺寸都是最优的固定阈值。因此,在噪声去除处理时,或者是遗留下太多的噪声,或者是不适当地去除了所扫描图像的部分。

由此,需要一种不存在上述问题的用于从图像去除噪声的方法和装置。

发明内容

本发明的一个实施例提供了一种从图像去除噪声的系统。在操作期间,系统首先识别出图像中的斑点,其中斑点是可能表示图像中的字符或者字符一部分的邻近像素的集合。接着,系统分析所述斑点以便针对斑点来动态地确定“噪声阈值”。然后,系统从图像去除低于噪声阈值的斑点。

在此实施例的变型中,分析斑点包括分析以下内容:斑点的尺寸分布、斑点的数量、斑点的位置、图像或者图像区域的斑点密度、以及斑点的颜色。

在此实施例的变型中,系统通过首先识别图像中的文本区域、以及然后识别文本区域中的“关键字符”来确定噪声阈值,其中关键字符是小字符或者字符的一部分,诸如句号、字符“i”上的点或者逗号。接着,系统计算所识别的关键字符的平均尺寸,并将噪声阈值计算为平均尺寸的一个分数(fraction)。

在此实施例的一个变型中,在分析斑点之前,系统通过从图像去除低于初始噪声阈值的斑点来执行初始噪声去除操作。

在此实施例的一个变型中,如果所确定的噪声阈值不同于先前的噪声阈值,则系统重复噪声去除处理。此外,如果所确定的噪声阈值由先前的噪声阈值有所降低,则系统恢复小于先前的噪声阈值但是大于所确定的噪声阈值的先前已去除斑点。

在此实施例的一个变型中,针对每个识别的文本区域来独立地确定噪声阈值。

附图说明

图1示出了根据本发明的一个实施例的样本文档;

图2示出了根据本发明的一个实施例的样本文档中的数个兴趣点;

图3示出了根据本发明的一个实施例的噪声去除处理;

图4示出了根据本发明的一个实施例的计算环境;

图5示出了根据本发明的一个实施例的噪声去除系统;

图6示出了根据本发明的一个实施例的光学字符识别(OCR)系统;

图7呈现了示出根据本发明的一个实施例的噪声去除处理的流程图;以及

图8呈现了根据本发明的一个实施例的OCR处理的流程图,该OCR处理包括对噪声去除处理的优化。

具体实施方式

呈现以下描述以便使得本领域技术人员能够制造和使用本发明,并且在特定应用及其需求的上下文中提供了下文的描述。对所公开的实施例的各种变型,其对于本领域技术人员是易见的,并且在此定义的通用原理可以应用于其他实施例和应用,而并不脱离本发明的精神和范围。由此,本发明并非旨在于局限于所示出的实施例,而是旨在于符合与在此公开的原理和特征的相一致的最为宽广的范围。

在此详细说明书中描述的数据结构和代码通常存储在计算机可读存储介质上,所述计算机可读介质可以是用于由计算机系统使用的能够存储代码和/或数据的任何设备或者介质。这包括但不限于:磁和光的存储设备,诸如,磁盘驱动器、磁带、CD(压缩盘)以及DVD(数字通用盘或者数字视频盘)。

概要

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥多比公司,未经奥多比公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200680045042.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top