[发明专利]文字行提取方法和装置有效
| 申请号: | 201010568411.2 | 申请日: | 2010-11-30 |
| 公开(公告)号: | CN102063619A | 公开(公告)日: | 2011-05-18 |
| 发明(设计)人: | 李永彬 | 申请(专利权)人: | 汉王科技股份有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100193 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供一种文字行提取方法和装置,属于光学字符识别领域。包括:对全景二值图像的各连通域统计,得到字符宽度和字符高度,根据字符宽度和字符高度对各连通域合并;将得到各第一尺度块间的参考水平间距,根据参考水平间距将各第一尺度块合并;将得到各第二尺度块间的第二参考水平间距,根据第二参考水平间距将各第二尺度块合并;将得到的第三尺度块排序后将第三尺度块左右两端既定数目的第一尺度块作延长线,根据延长线将各第三尺度块合并为文字行。本发明分别对应字符、单词和词段进行多尺度合并,再以得到的文字行为基础自顶向下将被排除的尺度块添加回文字行中,减少了不完整字符对文字行提取的干扰,保证了得到的文字行的有效性和准确性。 | ||
| 搜索关键词: | 文字 提取 方法 装置 | ||
【主权项】:
一种文字行提取方法,其特征在于,包括如下步骤:步骤一:对全景二值图像中的各连通域进行统计,得到字符宽度和字符高度,根据字符宽度和字符高度对各连通域进行合并,得到第一尺度块;步骤二:将得到的第一尺度块进行排序,得到各第一尺度块间的参考水平间距,根据参考水平间距将各第一尺度块进行合并得到第二尺度块;步骤三:将得到的第二尺度块进行排序,得到各第二尺度块间的第二参考水平间距,根据第二参考水平间距将各第二尺度块进行合并得到第三尺度块;步骤四:将得到的第三尺度块进行排序,排序后将第三尺度块左右两端既定数目的第一尺度块作延长线,根据延长线将各第三尺度块合并为文字行。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010568411.2/,转载请声明来源钻瓜专利网。





