[发明专利]用于内容识别的系统和方法有效
申请号: | 201010156688.4 | 申请日: | 2006-08-25 |
公开(公告)号: | CN101819632A | 公开(公告)日: | 2010-09-01 |
发明(设计)人: | 詹姆斯·T·史密斯第二;李红;约瑟夫·S·齐斯兹克泽维斯基 | 申请(专利权)人: | 普驰有限责任公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 邹姗姗 |
地址: | 美国科*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 内容 识别 系统 方法 | ||
本发明是申请日为2006年8月25日、申请号为200610121882.2 且发明名称为“用于内容识别的系统和方法”的发明专利申请的分案 申请。
技术领域
本发明涉及扫描图像分割,具体上涉及识别在被扫描的文件中的文 本、图像和艺术线条内容。
背景技术
诸如绝版(out-of-print)书籍之类的硬拷贝文件的传统数字化是缓 慢和困难的。部分地,所述困难起因于识别在给定文件中的各种类型 内容的需要。一些典型内容类型是文本、图像和艺术线条。文本一般 包括具有一致大小的小字符或符号。艺术线条一般包括线条和图案的 绘制图。图像一般包括具有许多中间级(诸如灰度)来描绘某个画面的 画面。文本和艺术线条基本上是双级的(例如黑和白)。相反,图像具 有更多的半色调形式的灰度级(例如在8位系统中的256级)(例如,近 似于中间色或阴影——诸如灰色——的空间分布的高分辨率像素)。
术语“扫描内容”在此用于指被扫描和数字化的任何内容。术语“图 像内容”指在扫描内容中的特定类型的内容、半色调图像。其他类型 的内容包括文本和艺术线条,如上所述。为了保持扫描内容的优质再 现,可以不同的方式来处理不同的内容类型。但是,为了以不同的方 式来处理不同的内容类型,可能需要首先识别每个内容类型。
一种传统的扫描技术使用在文件中的不同内容类型的人工识别。例 如,一个人在内容段周围物理地绘制矩形限制的方框或其他标识符, 以指示应当以某种方式来处理所述被限制的内容。内容段指具有一致 内容类型的扫描文件或扫描内容的一部分。可以按照默认处理模式来 处理在所述限制方框之外的内容。因此,在一个示例中,一个人可以 在半色调图像段周围而不是在文本段周围绘制矩形限制方框。所述半 色调图像可以被去遮蔽(descreen)以去除半色调,并且可以将文本简单 地按比例放大到较高的分辨率,并且将阈值按比例变为两级。传统的 去遮蔽使用用于将半色调平滑为共色(contone)图像的算法。不幸的是, 这种用于在图像周围绘制矩形限制方框的传统方法缓慢并且成本大。
另一种传统的扫描技术使用局部优化,局部优化使用在扫描内容中 的局部信息,确定是否应当将内容段当作两级文本和艺术线条或半色 调图像。但是,局部优化没有足够的信息来将扫描文件分割为可以按 照每个段的内容类型而不同地处理的独立内容段。结果,局部优化扫 描技术可导致降低的图像质量。
从上述的讨论应当清楚的是,需要一种用于克服传统扫描分段技术 的装置、系统和方法。有益的是,这样的装置、系统和方法将比人工 分段更快和简单。另外,这样的装置、系统和方法将比局部优化技术 更准确。
发明内容
响应于本领域的当前状态,具体上响应于还没有由当前的扫描分段 技术完全解决的本领域内的问题和需要,已经开发了本发明的几个实 施例。因此,本发明已经被开发来提供一种用于扫描分段的装置、系 统和方法,其克服了在本领域内的许多或全部上述缺陷。
本发明的各实施例便于扫描分段。具体上,某些实施例自动化扫描 分段,包括识别段和每个段的内容类型。
用于识别在扫描内容中的内容的装置配备逻辑单元,它包括多个模 块,它们被配置来在功能上执行扫描分段所需要的操作。在所述实施 例中的这些模块包括图像模块、修改模块、识别模块、分段模块、面 积计算模块、面积比较模块、子图像模块、直方图计算模块、直方图 比较模块和相邻模块。 在一个实施例中,所述图像模块访问扫描内容数据集。所述扫描内 容数据集可以作为修改内容数据集的基础,所述修改内容数据集继而 可以用于识别扫描内容的可能内容类型。
在一个实施例中,所述修改模块从扫描内容数据集建立修改内容数 据集。为了建立修改内容数据集,修改模块可以向扫描内容数据集应 用数学函数。在一个实施例中,所述修改模块向扫描内容数据集应用 S形函数,以便建立修改内容数据集。
在一个实施例中,所述识别模块识别在修改内容数据集内的内容 段。所述识别模块可以使用8相邻连接性确定来识别修改内容数据集 的内容段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普驰有限责任公司,未经普驰有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010156688.4/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法