[发明专利]复杂环境中紧连字符串的字符分离方法有效
申请号: | 201310209927.1 | 申请日: | 2013-05-30 |
公开(公告)号: | CN103258196A | 公开(公告)日: | 2013-08-21 |
发明(设计)人: | 李晓峰;周洁芸;舒畅;刘洪盛;徐进 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 环境 中紧连 字符串 字符 分离 方法 | ||
技术领域
本发明涉及一种对紧连字串的字符分离方法,特别适用于各种真实票据中数字串的切分方法。
背景技术
票据作为目前生活工作中经常使用的工具,为了更加方便的将票据上的一些信息转化为数字信息进行后续的处理,通常会使用一些自动识别处理的方法。在识别字符之前的一个十分重要的步骤就是将待识别的字符串切分开。但是票据中复杂的背景信息,紧密粘连的字符,是目前各种切分方法都会面临的难题。因此,复杂环境中紧连字串的切分问题,具有很大的研究价值和应用前景。
目前常采用的切分方法有三种,第一种是水平投影法,即按照水平方向,计算垂直方向中投影的最低点,得到属于目标字符的分割位置,但是在复杂环境及紧连字串中,这种方法的可行性就大大降低,背景噪声以及粘连会影响投影分点切分的准确性,从而错误的计算出分点的位置。目前常采用的另一种方法是通过字符的连通性来进行字符的分割,即按照属于同一个字符的像素构成一个连通区域的原则进行切分,这种方法对于车牌识别等字符分点清晰连通区域明显的情况十分实用,但是对于真实票据中的经常存在字符粘连的情况就不能适用,准确率很低。第三种,基于模板匹配的切割算法,根据字符串的结构和尺寸特征,设计了字符串模板,用这样的模板在车牌区域滑动匹配进行字符的切割确定最佳匹配位置,但是这种方法,对于各种票据中的各种不同的字体就会出现很大的问题,因为他只适用于一种字体,或是变化不大的不同字体。
发明内容
本发明的目的在于,克服现在票据中复杂环境和粘连字符对切分的影响,提供一种适用于各种字体的字符分离方法。
本发明的复杂环境中紧连字符串的字符分离方法,包括下列步骤:
步骤1:对采集的字符串图像进行预处理,求取字符串的上包络值、下包络值,所述上包络值为字符串中字符的上边缘距离字符串图像上边缘的距离;所述下包络值为字符串中字符下边缘距离字符串图像下边缘的距离;
步骤2:基于所述上下包络值提取初级分点:
设定字符串的水平坐标上各点的权值:若当前点对应的上、下包络值均为字符串图像的高度,则设定为第一权值;若当前点对应的上、下包络值同时局部最大,则设定为第二权值,所述第二权值小于第一权值;若当前点对应的上包络值局部最大,则设定权值为第三权值, 所述第三权值小于第二权值;若当前点对应的下包络值局部最大,则设定权值为第四权值,所述第四权值小于第三权值;否则设定当前点的权值小于所述第四权值;
提取权值局部最大所对应的点为初级分点;
步骤3:对所述初级分点进行滤波处理,得到二级分点,取各二级分点为初级切分点;
步骤4:对所述初级切分点进行校准,确定切分位置。
为了进一步简化本发明的实现复杂度,所述步骤3中,基于初级分点得到二级分点为:
若当前初级分点与近邻的局部区域密度小于预设阈值,则将所述局部区域汇聚为一点,作为二级分点;否则直接提取当前初级分点为二级分点。
为了进一步提升本发明的切分准确性,所述步骤3中,还包括,过滤二级分点中的干扰点,得到最终分点:
基于各二级分点的相邻间距,设定参考分点间距DS,并根据所述DS检测并过滤二级分点中的干扰点,所述干扰点的检测为:
步骤3-1:依序确定首个与其右邻居的间距小于或等于w*DS的二级分点X,由所述二级分点X的前一个分点作为当前起点S,其中所述w∈[0.5,0.8];
步骤3-2:由当前起点S构建A-B-C三段路径,且点A、S的距离小于或等于a*DS,点A、B的距离小于或等于b*DS,点B、C的距离小于或等于c*DS,其中a∈[1,1.5],b∈[1,2],c∈[1,2];
取各段距离与所述DS的绝对差的总和最小时,对应的点A、B、C为正常分点,则A-B-C三段路径包含的非正常分点为干扰点;
步骤3-3:将正常分点C作为当前起点,执行步骤3-2。
综上所述,由于采用了上述技术方案,本发明的有益效果是:实现了在复杂环境下,对紧连字串的切分,且适用于不同字体,其运算复杂度低,切分准确性高。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明具体实施方式的流程图;
图2是本发明具体实施方式中,局部后向优化流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310209927.1/2.html,转载请声明来源钻瓜专利网。