[发明专利]一种粘连字符的识别方法有效

专利信息
申请号: 201910226647.9 申请日: 2019-03-25
公开(公告)号: CN110033004B 公开(公告)日: 2021-01-05
发明(设计)人: 朱杰英;卢盛林 申请(专利权)人: 广东奥普特科技股份有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62;G06T7/136
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 潘俊达
地址: 523000 广东省东莞*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 粘连 字符 识别 方法
【权利要求书】:

1.一种用于粘连字符的识别方法,其特征在于:

识别用的分类器要求除了能归类之外,还能度量到一个类的偏离度或距离,用dev*标记;实际用的偏离度dev是原始偏离度dev*加了补偿值,如果分类器直接导出的度量是按相似度sim或得分score的,可以按单调降函数转换为dev*,即dev*=-log(sim),或dev*=-log(score/100),也即dev=dev*+offset,补偿值是对于右侧当前预分割位置right_cur所处状态的一种惩罚因子;对dev设置两个可信阈值,一个是高可信阈值T1,一个是基本可信阈值T2,两者满足T2T1;

假设需要分割的字符以块为单位,每个块包含若干段,这里的段是指沿垂直字符排列方向投影字符区,投影值连续大于零的一个区间为一段;对每个块先计算三个参数值:前进步长step_pre、回退步长step_back和最大前进步数max_preTimes;然后对字符块采用边识别边分割字的方式,共分为五个步骤:

S1、初步预估:令初始的切割位置设在离左端为step_pre的位置处,如果切割的位置刚好位于空白处,则更改切割位置为相邻左段的右边界,如果右侧剩余的部分的宽度0.5×step_pre,则很可能是本字的小部分,就更改切割位置为本块右端;然后对截取区间内的目标计算特征并输入到分类器进行识别,如果最小偏离度dev_minT1,或者已经到达块的右边界并且dev_minT2,就按已经找到分割的位置,可以跳过步骤S2;否则如果只是dev_minT2,那么当前的作为候选分割位置;

S2、回退查找:从当前切割位置开始按步长step_back逐步回退,如果回退后的位置位于段之间的空白处,则更改当前位置为相邻左段的右边界;对截取区间内的目标计算特征并输入到分类器进行识别,如果还没有候选分割位置并且dev_minT2,则记录候选分割位置;如果有候选分割位置并且最小偏离度比候选位置的要小,则更新候选分割位置;如果当前dev_minT1,则停止回退,作为正式分割位置;

S3、增加字长:如果经过前面两步还没有找到候选分割位置,则向右增加一个长度为step_pre的段,重复执行步骤S1和步骤S2,只是截取的起始位置不变,但是回退查找的范围只为新增的这一段;重复增加字长,直到找到或者前进步数≥最大前进步数max_preTimes为止,如果前进步数≥最大前进步数max_preTimes,则按本块识别失败处理;

S4、位置细化:如果已经找到分割或候选分割位置pos_seg,且此位置是位于一个段的内部,则可以细化处理,按左右两处位置pos_seg-step_refine、pos_seg+step_refine测试是否有dev值更小,更小则更新位置,其中step_refine的初值为step_back/2,每次减半直到为1或满足所需为止;

S5、记录当前字的最终的分割位置和识别结果;然后计算下一个字的起始位置,也即去掉当前切割位置左侧的部分后,本块剩余部分投影像素值不为0的最左位置,重复上述步骤直到本块识别完毕。

2.如权利要求1所述的粘连字符的识别方法,其特征在于:

前进步长为step_pre=Hb×WH_ave×(1+Δ)×P,其中Δ为一小值,满足0≤Δ≤0.2,Hb为本块块高,WH_ave为训练样本的字平均宽高比,P约为识别目标和训练样本的平均宽高比之比,一般情况下值为1。

3.如权利要求2所述的粘连字符的识别方法,其特征在于:

回退步长为step_back=Hb/K,其中K≥6。

4.如权利要求2所述的粘连字符的识别方法,其特征在于:

最大前进步数为max_preTimes=WH_max/(WH_ave×(1+Δ))+1,其中WH_max为训练样本集中的字宽高比的最大值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东奥普特科技股份有限公司,未经广东奥普特科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910226647.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top