[发明专利]复杂环境中紧连字符串的字符分离方法有效
申请号: | 201310209927.1 | 申请日: | 2013-05-30 |
公开(公告)号: | CN103258196A | 公开(公告)日: | 2013-08-21 |
发明(设计)人: | 李晓峰;周洁芸;舒畅;刘洪盛;徐进 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 环境 中紧连 字符串 字符 分离 方法 | ||
1.复杂环境中紧连字符串的字符分离方法,其特征在于,包括下列步骤:
步骤1:对采集的字符串图像进行预处理,求取字符串的上包络值、下包络值,所述上包络值为字符串中字符的上边缘距离字符串图像上边缘的距离;所述下包络值为字符串中字符下边缘距离字符串图像下边缘的距离;
步骤2:基于所述上下包络值提取初级分点:
设定字符串的水平坐标上各点的权值:
若当前点对应的上、下包络值均为字符串图像的高度,则设定为第一权值;
若当前点对应的上、下包络值同时局部最大,则设定为第二权值,所述第二权值小于第一权值;
若当前点对应的上包络值局部最大,则设定权值为第三权值,所述第三权值小于第二权值;
若当前点对应的下包络值局部最大,则设定权值为第四权值,所述第四权值小于第三权值;
否则设定当前点的权值小于所述第四权值;
提取权值局部最大所对应的点为初级分点;
步骤3:基于所述初级分点对应的权值,对初级分点进行低通滤波处理,得到二级分点,取各二级分点为初级切分点;
步骤4:对所述初级切分点进行校准,确定切分位置。
2.如权利要求1所述的方法,其特征在于,所述步骤3中,基于初级分点得到二级分点为:
若当前初级分点与近邻的局部区域密度小于预设阈值,则将所述局部区域汇聚为一点,作为二级分点;否则直接提取当前初级分点为二级分点。
3.如权利要求2所述的方法,其特征在于,对密度小于预设阈值的局部区域进行汇聚时,提取所述局部区域的中心位置所对应的初级分点为二级分点。
4.如权利要求1、2或3所述的方法,其特征在于,所述步骤3中,还包括,过滤二级分点中的干扰点,得到最终分点:
基于各二级分点的相邻间距,设定参考分点间距DS,并根据所述DS检测并过滤二级分点中的干扰点,所述干扰点的检测为:
步骤3-1:依序确定首个与其右邻居的间距小于或等于w*DS的二级分点X,由所述二级分点X的前一个分点作为当前起点S,其中所述w∈[0.5,0.8];
步骤3-2:由当前起点S构建A-B-C三段路径,且点A、S的距离小于或等于a*DS,点A、B的距离小于或等于b*DS,点B、C的距离小于或等于c*DS,其中a∈[1,1.5],b∈[1,2],c∈[1,2];
取各段距离与所述DS的绝对差的总和最小时,对应的点A、B、C为正常分点,则A-B-C三段路径包含的非正常分点为干扰点;
步骤3-3:将正常分点C作为当前起点,执行步骤3-2。
5.如权利要求4所述的方法,其特征在于,所述步骤3-2中,从A点开始确定A-B-C三段路径。
6.如权利要求4或5所述的方法,其特征在于,设定参考分点间距DS为:取分布概率最大的相邻间距为参考分点间距DS。
7.如权利要求4所述的方法,其特征在于,设定参考分点间距DS为:去掉相邻间距小于预设值T1的左邻二级分点,然后去掉剩余二级分点的左端1/4的二级分点,再对剩下的点二级分点通过直方图获取DS。
8.如权利要求1或2所述的方法,其特征在于,所述步骤4中,对初级切分点进行校准为:对初级切分点、及其左右三个邻近像素点,分别计算字符高度,由最小字符高度所对应的像素点作为当前初级切分点的切分位置,且优先选择靠近初级切分点的位置。
9.如权利要求3所述的方法,其特征在于,所述步骤4中,对初级切分点进行校准为:对初级切分点、及其左右三个邻近像素点,分别计算字符高度,由最小字符高度所对应的像素点作为当前初级切分点的切分位置,且优先选择靠近初级切分点的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310209927.1/1.html,转载请声明来源钻瓜专利网。