[发明专利]文字行提取方法和装置有效
| 申请号: | 201010568411.2 | 申请日: | 2010-11-30 |
| 公开(公告)号: | CN102063619A | 公开(公告)日: | 2011-05-18 |
| 发明(设计)人: | 李永彬 | 申请(专利权)人: | 汉王科技股份有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100193 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文字 提取 方法 装置 | ||
技术领域
本发明属于光学字符识别领域,特别涉及一种文字行提取方法和装置。
背景技术
电子扫描笔(简称扫描笔)是OCR的重要应用之一。扫描笔的技术原理为:首先,光学摄像头按照一定频率对被扫描资料进行连续拍照,获取被扫资料的图像序列,然后将图像序列拼接成一幅全景二值图像,最后在得到的全景图像中提取待识别文字行并进行OCR识别。
文字行提取有多种方法,大体分为自顶向下、自底向上以及自顶向下自底向上两者相结合三种,但这些方法多是针对印刷体文档或者手写文本的,对于扫描笔获取的全景二值图像处理效果不好。这是因为扫描笔获取的全景二值图像具有其自身的不同于印刷体文档及手写文本的特点:(1)图像内的文字行很少,图像内的字符存在不完整的情况,故得到的图像不利于信息统计,使部分自底向上的方法失效;(2)图像的文字行形状多变,有可能是倾斜的,甚至是弯曲的,使部分自顶向下的方法失效。为此,需要一种专门针对扫描笔获取的全景二值图像的文字行提取方法。
发明内容
本发明所要解决的问题为提供一种文字行提取方法和装置,利用全景二值图像的特点去除图像中的不完整字符,有效减小了不完整字符对合并的干扰,然后采用一种自底向上和自顶向下相结合的方法实现文字行提取。
本方法公开了一种文字行提取方法,包括如下步骤:
步骤一:对全景二值图像中的各连通域进行统计,得到字符宽度和字符高度,根据字符宽度和字符高度对各连通域进行合并,得到第一尺度块;
步骤二:将得到的第一尺度块进行排序,得到各第一尺度块间的参考水平间距,根据参考水平间距将各第一尺度块进行合并得到第二尺度块;
步骤三:将得到的第二尺度块进行排序,得到各第二尺度块间的第二参考水平间距,根据第二参考水平间距将各第二尺度块进行合并得到第三尺度块;
步骤四:将得到的第三尺度块进行排序,排序后将第三尺度块左右两端既定数目的第一尺度块作延长线,根据延长线将各第三尺度块合并为文字行。
所述步骤一之前还包括:
步骤a:标记全景二值图像中的连通域,统计各连通域的高度得到全景二值图像中的平均字符高;
步骤b:去除全景二值图像边缘处高度小于平均字符高既定比例的连通域。
所述步骤一中对全景二值图像中的各连通域进行统计时,按各连通域的宽度值统计对应的连通域个数,按宽度值从大到小的顺序将其对应的连通域个数加和,取加和大于等于连通域总数的五分之一时对应的宽度值作为字符宽度。
所述步骤一中对全景二值图像中的各连通域进行统计时,按各连通域的高度值统计对应的连通域个数,按高度值从大到小的顺序将其对应的连通域个数加和,取加和值大于等于连通域总数的五分之一时对应的高度值作为字符高度。
所述步骤一之后还包括:去除小于字符高度二分之一的第一尺度块。
所述步骤二的参考水平间距为两相邻的第一尺度块间的水平间距的中值。
所述步骤二中将各第一尺度块进行合并得到第二尺度块时,依次遍历各第一尺度块,将未经合并的当前第一尺度块作为第二尺度块,并将满足既定条件的未经合并的第一尺度块合并到所述第二尺度块。
所述既定条件为第二尺度块与相邻的第一尺度块在竖直方向有交叠,且交叠高度大于等于两者中高度较小者的三分之一,且第二尺度块与相邻的第一尺度块的水平间距小于等于2倍参考水平间距且大于等于负的字符宽度的三分之一。
所述步骤三的第二参考水平间距为两相邻的第二尺度块间的小于2倍字符宽度的水平间距的中值。
所述步骤三中将各第二尺度块进行合并得到第三尺度块时,依次遍历各第二尺度块,将未经合并的当前第二尺度块作为第三尺度块,并将满足第二既定条件的未经合并的第二尺度块合并到所述第三尺度块。
所述第二既定条件为第三尺度块与相邻的第二尺度块在竖直方向有既定高度的交叠;且第三尺度块与相邻的第二尺度块的水平间距大于零、小于等于2倍第二参考水平间距。
所述步骤三还包括对得到的第三尺度块进行验证,如果与当前第二尺度块相邻的、与合并方向相反的第二尺度块和当前第二尺度块在竖直方向有高度大于既定高度的交叠,且两相邻的第二尺度块的水平间距不大于2倍水平间距,则当前第二尺度块不能合并至第三尺度块中,当前第三尺度块结束合并。
所述步骤四中的延长线分别由位于第三尺度块中最左侧既定数目的第一尺度块和最右侧的既定数目的第一尺度块生成,通过提取各第一尺度块的中心点坐标用最小二乘法拟合得到。
所述步骤四中的既定数目为三个及三个以上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010568411.2/2.html,转载请声明来源钻瓜专利网。





