[发明专利]在包括西文字符和象形字符的图像中文本行的分割有效

专利信息
申请号: 201180017874.2 申请日: 2011-03-25
公开(公告)号: CN102822845A 公开(公告)日: 2012-12-12
发明(设计)人: I.米蒂克 申请(专利权)人: 微软公司
主分类号: G06K7/10 分类号: G06K7/10;G06K9/18;G06K9/46
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 刘鹏;汪扬
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 包括 西文 字符 象形 图像 中文 本行 分割
【说明书】:

背景技术

光学字符识别(OCR)是一种基于计算机的转换,其一般以标准编码方案中将文本的图像转换成如机器可编辑文本那样的数字形式。这个过程消除了向计算机系统中人工键入文档的需要。OCR过程典型地通过获得承载印刷文本消息的物理文档的电子文件并利用诸如光学扫描仪之类的装置扫描文档开始。这样的装置产生原始文档的电子图像。然后将输出图像供应给计算机或其他处理装置,并处理被扫描文档的图像以在图像和文本之间进行区分,并确定明亮和黑暗区域中代表的是什么字母。

越来越多地使用计算机和因特网的结果是,与更频繁地在全世界使用英语结合,发现包括西文文字和东亚(例如中国、日本、韩国)文本组合的文本图像变得很常见,其形式常常是西文文字混合在东亚文本选集中。因此,用于东亚文本的OCR引擎应当理想地能够识别具有东亚和西文文本混合的文本行。

发明内容

为了支持OCR过程,需要识别仅有东亚文本字符间中断和个体字符的东亚或象形文本行。此外,对于既有西文又有东亚文本的文本行,需要将文本的西文和东亚片段彼此分开,并且需要向每个片段应用适当的文本识别逻辑。

在一种实施方式中,提供了一种方法和设备,用于对包括文本行的输入图像进行字符识别。该方法沿着文本行识别候选字符间中断并将每个候选字符间中断分类为实际中断、非中断或不确定中断。至少部分基于每个相应候选字符间中断和与其相邻的字符划界框的几何性质实现字符间中断分类。至少部分基于从每个相应候选字符提取的特征组识别所述候选字符。可以用于字符识别的一个特定特征组是Gabor特征组。

在另一种实施方式中,提供了一种图像处理设备用于分割文本行的西文和象形部分。该设备包括接收具有至少一个文本行的输入图像的输入部件。该设备还包括沿着文本行识别候选字符间中断的字符间中断标识符部件和字符间中断分类器部件。字符间中断分类器部件至少部分基于每个相应候选字符间中断和与其相邻的字符划界框的几何性质,将每个候选字符间中断分类为实际中断、非中断或不确定中断。字符识别部件至少部分基于从每个相应候选字符提取的特征组识别所述候选字符。西文和象形文本分类器部件将文本行分割成西文文本片段或象形文本片段,并向输出部件输出结果。

提供本发明内容是为了以简化形式介绍在下面具体实施方式中将进一步论述的概念的选择。本发明内容并非要标识所要求保护的主题的关键特征或必要特征,也并非要用作在确定所要求保护的主题范围时的辅助。

附图说明

图1和2分别示出了西文和东亚文本的文本行。

图3示出了包含西文和象形文本的混合的文本行。

图4示出了图像处理设备的一个范例,图像处理设备执行分割文本行的西文和象形部分的过程。

图5a和5b示出了东亚文本字符的范例,该东亚文本字符被它们的相应划界框和它们之间候选字符间中断围绕。

图6a示出了预处理之前的字符图像,连同其划界框的宽度和高度;图6b示出了已经拉伸之后的字符。

图7-12示出了经历文本分割过程时的文本行。

图13为示出了将文本行分成西文和象形文本片段的过程的一个范例的流程图。

具体实施方式

光学字符识别(OCR)过程的一种重要方面是行识别和分割。不过,行的概念对于西文文本和东亚文本(或者更一般地,任何基于象形的文本,其中单个书写字符表示单词)而言具有不同含义。可以在图1和2中看出这种区别,它们分别示出了西文和东亚文本的文本行。具体而言,对于象形文本行而言,仅有字符的概念,而对于西文文本行而言,还有单词的概念。在其他情况下,例如这里论述的那些情况,文本行包含西文和象形文本的混合(图3)。

为了支持用于西文和东亚或象形文本混合的OCR过程,需要解决若干问题。具体而言,对于仅有东亚文本的文本行,需要识别正确的字符间中断和个体字符。此外,对于既有西文文本又有东亚文本的文本行,必须要将文本行适当分割成西文和东亚文本片段。这些问题中的每一个都将得到逐一解决。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201180017874.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top