[发明专利]后光学字符识别处理中的形状聚类有效
申请号: | 201110425054.9 | 申请日: | 2007-09-07 |
公开(公告)号: | CN102637256A | 公开(公告)日: | 2012-08-15 |
发明(设计)人: | 路克·文森特;雷蒙德·W·史密斯 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/20 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 光学 字符 识别 处理 中的 形状 | ||
本申请属于2009年5月7日提交的中国专利申请200780041456.0的分案申请。
该PCT申请要求以下四个美国专利申请的优先权:
于2006年9月8日提交的题为“Shape Clustering in Post OpticalCharacter Recognition Processing”的No.11/517,818;
于2006年9月11日提交的题为“Shape Clustering and Cluster-LevelManual Identification in Post Optical Character Recognition Processing”的No.11/519,368;
于2006年9月11日提交的题为“Optical Character Recognition basedon Shape Clustering and Multiple Optical Character RecognitionProcesses”的No.11/519,376;和
于2006年9月11日提交的题为“High Resolution Replication ofDocument based on Shape Clustering”的No.11/519,320。
以上专利申请的公开内容通过引用合并为本申请说明书的一部分。
技术领域
本说明书涉及形状聚类和光学字符识别。
背景技术
光学字符识别(OCR)使用一般将被称作OCR引擎的计算机软件来对原本在纸张、缩影胶片或其它介质上印刷的、打字的、手写的或其它书写文本的数字图像进行处理,并且从所述图像产生机器可识别和可编辑的文本。通过OCR引擎处理的文档的数字图像可包括多页书写材料的图像。要由OCR引擎进行处理的文本的图像可通过各种成像方法来获取,包括使用图像扫描仪来捕捉文本的数字图像。
OCR引擎通常产生矩形边框旨在共同地围住每个页面上所写的文本。通常,当文档图像具有灰度或色彩信息时,OCR引擎对所述图像进行二进制化以使得将每个图像像素确定为前景像素(例如,黑色文本)或背景像素(例如,白色区域)。每个边框通常围住OCR引擎所感知(perceive)的一个字符的文本像素的一个或多个连接群组,但是也可以与相邻字符的一部分重叠,或者在极端情况下,可以完全重叠。在这样的情形中,现有几种方法将OCR引擎识别为属于所述边框内部的像素与属于不同但重叠边框的像素分离。这些方法包括:通过阈值和所连接成分的分析来生成掩膜图像,构建轮廓多边形,并且构建并行四边形的边框。OCR引擎通常为每个边框指派一个或多个OCR字符码。每个OCR码识别所述引擎已认出在该边框内的一个或多个字符。如果OCR引擎无法认出边框中的任何字符,则其可不向该边框指派OCR字符码。OCR字符码所识别的每个字符可以以标准字符编码进行表示,例如ASCII或统一字符编码。
每个边框可被认为是对文档图像的一部分或小图像进行隔离的剪切(clipping)路径,无论其为原始形式或经二进制化的二进制形式。由于这些小图像可被认为是由其相应的边框从文档图像剪切而来,所以这些小图像将被称作剪切(clip)或剪切图像。由于每个剪切图像被绑定到边框、OCR字符码,所以指派给边框的字符也能够被称作或识别为指派给所述剪切图像的代码或字符。除非另外指出,术语剪切或剪切图像是指作为文档图像的一部分并且由OCR引擎所处理以便进行字符识别的图像。
OCR引擎在该处理期间可能产生错误。例如,OCR引擎通过例如仅包括边框中的部分字符或包括在单个边框中被认作单个字符的多个字符而对原始图像进行了不正确分割。作为另一个示例,OCR引擎由于边框所围住的剪切图像和用于不同字符码的参考图像之间的一些图像相似性或者由于该OCR引擎所接收的数字图像的低图像质量而对边框指派不正确的OCR字符。
发明内容
除其它内容之外,该说明书描述了用于在包括光学字符识别(OCR)处理的输出在内的各种文档的处理中进行形状聚类和应用的技术和系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110425054.9/2.html,转载请声明来源钻瓜专利网。