[发明专利]将包含文字的数字图像转换为用于再现的基于记号的文件有效
申请号: | 201110095514.6 | 申请日: | 2007-03-22 |
公开(公告)号: | CN102176230A | 公开(公告)日: | 2011-09-07 |
发明(设计)人: | A·B·考斯;F·Z·R·阿卡林;R·L·古德温;J·沙干 | 申请(专利权)人: | 亚马逊科技公司 |
主分类号: | G06K9/72 | 分类号: | G06K9/72;G09G5/28 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 李向英 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包含 文字 数字图像 转换 用于 再现 基于 记号 文件 | ||
本申请是申请人于2007年3月22日提交的,申请号为200780015565.5,发明名称为“将包含文字的数字图像转换为用于再现的基于记号的文件”的发明专利申请的分案申请。
技术领域
本发明涉及数字图像的处理,具体来说,涉及其中具有文字的内容的图像的处理。
背景技术
随着计算机和基于计算机的网络的应用越来越广,内容提供商以电子形式准备和分发越来越多的内容。此内容包括传统媒体,如以印刷的形式存在的书、杂志、报纸、时事通讯、手册、指南、参考书、文章、报告、文档等等,以及电子媒体,其中,前面所说的内容以数字形式存在,或是通过使用扫描设备从印刷形式转换为数字形式的。特别是,因特网,通过下载和显示内容的图像,有助于更广泛地发布数字内容。随着数据传输速度的提高,越来越多的内容的页面的图像出现在网上。页面图像可使读者看到内容的页面,如同出现在印刷品中那样。
尽管提供内容的数字图像有巨大吸引力,但是,许多内容提供商在生成和存储内容的图像时面临着许多挑战,特别是当识别图像中的文字的准确性非常重要时。例如,为使用户能从计算机屏幕上的书或杂志读取页面图像,或为将它们打印下来供以后阅读,图像必须足够清晰,才能呈现清晰的文字。当前,使用各种字符识别技术来将图像转换成计算机可读取的数据,如包括数字字符识别的光学字符识别 (OCR)。虽然光学字符识别的准确性一般而言比较高,但是,某些页面图像,甚至在经过OCR处理之后,由于各种伪像,简直难以辨认。尽管手动校正是可以的,但是,以人工方式校正错误地识别的字符或插入遗漏的字符的成本非常高,特别是在扫描大量的页面时。
数字内容提供商所面临的另一个挑战是存储内容的图像的成本。为降低存储成本,内容提供商希望使用于存储图像的文件的大小最小化。数字图像可以以各种分辨率来呈现,分辨率通常通过图像在水平方向和垂直方向的像素的数量来表示。通常,尽管不一定总是,较高分辨率的图像,其文件大小较大,存储时需要较大的存储器量。当考虑需要捕获并存储大量的诸如书、杂志等等之类的介质的图像的数量时,存储内容的图像的成本大大地翻倍。尽管缩小图像的大小和分辨率会降低存储图像的要求,但是,低分辨率图像最终会到达一个点,此时,图像,特别是其中包含的任何文字,在显示时,对于读者来说难以阅读。希望在页面图像上提供文字的内容提供商必须确保图像可以以足够高的分辨率来呈现,以便显示的文字将是清晰的。内容提供商所面临的再一个挑战是提供可缩放的页面图像,即,可以轻松地或缩小以便,例如,在各种大小的显示器上,以比较高的分辨率再现,同时确保最小质量和图像中的文字的易读性。
所需要的是,用于可靠地处理包括文字的通过扫描获得的页面图像的方法和系统,以便页面图像中的文字,在再现时,将是清晰的,并且分辨率足够高,并进一步可缩放,无需过量的存储空间用来进行存储。
发明内容
为解决现有技术中的上文所描述的问题及其他缺点,本发明提供了一种可以在计算机中实现的方法,用于将通过扫描获得的内容的页面转换为“基于记号”的文件。如这里所使用的,记号是指一个图形单元,可以代表或者也可以不代表单一字符或符号。从通过扫描获得的页面图像,分离出很多记号。然后,形状类似的记号可以分组在一起, 将它们的形状组合起来,以创建组合的记号,该组合记号在形态上是组中包括的所有记号的代表。组合的记号进一步被转换为矢量化记号,这是组合记号的数学表示,并能够以清楚的曲线表示组合的记号的形状。对于内容的通过扫描获得的页面,例如,一本书,如此创建了许多矢量化记号,每一个矢量化记号都代表一组形状类似的记号。此后,将构成一个组的每一个(原始,未处理的)记号的位置与代表记号组的矢量化记号相关联。例如,每一个记号的位置可以由页编号和记号出现的每一个页面内的位置的X-Y坐标进行定义,位置与指向对应的矢量化记号的指针相关联。如此,在再现时,是矢量化记号而不是原始记号显示在此位置,从而创建只包括矢量化记号的页面图像。因为矢量化记号是记号形状的数学表达式,它们可以以任何分辨率再现,包括高分辨率,当显示时,显得“清爽(crisp)”和易读。此外,由于形状类似的记号的多个位置仅仅与指向它们的代表性的矢量化记号的指针相关联,因此,页面图像的存储要求可以最小化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亚马逊科技公司,未经亚马逊科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110095514.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可挠式基板结构及其制作方法
- 下一篇:薄膜晶体管阵列基板及其制作方法