[发明专利]在包括西文字符和象形字符的图像中文本行的分割有效
申请号: | 201180017874.2 | 申请日: | 2011-03-25 |
公开(公告)号: | CN102822845A | 公开(公告)日: | 2012-12-12 |
发明(设计)人: | I.米蒂克 | 申请(专利权)人: | 微软公司 |
主分类号: | G06K7/10 | 分类号: | G06K7/10;G06K9/18;G06K9/46 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 刘鹏;汪扬 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包括 西文 字符 象形 图像 中文 本行 分割 | ||
1.一种用于对输入图像执行字符识别的方法,包括:
接收包括至少一个文本行的输入图像;
沿着所述文本行识别候选字符间中断;
至少部分基于每个相应候选字符间中断和与其相邻的字符划界框的几何性质将每个候选字符间中断分类为实际中断、非中断或不确定中断;以及
至少部分基于从每个相应候选字符提取的特征组识别所述候选字符。
2.根据权利要求1所述的方法,其中对每个候选字符间中断分类所依据的几何性质包括相邻字符划界框相对于估计的文本行字符高度的尺寸和位置。
3.根据权利要求2所述的方法,其中对每个候选字符间中断分类所依据的几何性质还包括相应候选字符间中断及其相邻中断相对于文本行平均中断尺寸的尺寸。
4.根据权利要求3所述的方法,其中对每个候选字符间中断分类所依据的几何性质还包括针对文本行中候选字符的估计字符宽度的规则程度。
5.根据权利要求1所述的方法,其中识别所述候选字符包括在输入灰度图像上拉伸候选字符。
6.根据权利要求1所述的方法,其中识别所述候选字符包括利用字符特征组执行特征计算并通过利用任何当前或将来的分类算法基于字符特征组执行分类。
7.一种用于分割文本行的西文和象形部分的图像处理设备,包括:
输入部件,其接收包括至少一个文本行的输入图像;
字符间中断标识符部件,其沿着所述文本行识别候选字符间中断;
字符间中断分类器部件,其至少部分基于每个相应候选字符间中断和与其相邻的字符划界框的几何性质将每个候选字符间中断分类为实际中断、非中断或不确定中断;
字符识别部件,其至少部分基于从每个相应候选字符提取的特征组识别所述候选字符;
西文和象形文本分类器部件,其将所述文本行分割成西文文本片段和象形文本片段;以及
输出部件,其接收行分割和识别结果。
8.根据权利要求7所述的图像处理设备,其中所述西文和象形文本分类器部件被配置成移除非中断点并分辨未定点且识别个体西文和象形字符。
9.根据权利要求8所述的图像处理设备,其中所述西文和象形文本分类器部件还被配置成基于西文单词中断算法识别文本行中的单词间中断。
10.根据权利要求9所述的图像处理设备,其中所述西文和象形文本分类器部件被配置成在已经被识别为置信水平大于阈值水平的象形字符的每个字符周围放置单词间中断。
11.根据权利要求10所述的图像处理设备,其中所述西文和象形文本分类器部件被配置成,通过检查至少一个附加字符特征,在已经被识别为置信水平低于阈值水平的象形字符的每个附加字符周围放置单词间中断。
12.根据权利要求11所述的图像处理设备,其中所述附加字符特征包括相对于该字符左边和右边的字符的高度的字符高度、该字符左边和右边的字符的身份以及相对于行高的字符高度。
13.根据权利要求12所述的图像处理设备,其中所述西文和象形文本分类器部件被配置成确定位于相继单词间中断之间的文本片段中的西文字符的数量与文本片段中字符总数的比率,并且如果所述比值超过预定阈值,将所述文本片段分类为西文文本片段,否则将其分类为象形文本片段。
14.根据权利要求13所述的图像处理设备,还包括西文单词识别器引擎,用于识别西文文本片段中的单词。
15.根据权利要求14所述的图像处理设备,其中所述西文单词识别器引擎提供西文单词识别结果和与其关联的置信水平,其中所述置信水平表示所识别单词被正确识别的概率,且其中所述西文和象形文本分类器部件还被配置成,如果所述置信水平低于阈值水平,将所述西文文本片段重新分类为象形文本片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180017874.2/1.html,转载请声明来源钻瓜专利网。