[发明专利]一种汉字图片的部件识别方法有效

专利信息
申请号: 201210454936.2 申请日: 2012-11-13
公开(公告)号: CN102968619A 公开(公告)日: 2013-03-13
发明(设计)人: 梁晓辉;于博文;孙林嘉 申请(专利权)人: 北京航空航天大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46;G06K9/62
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 成金玉;贾玉忠
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 汉字 图片 部件 识别 方法
【权利要求书】:

1.一种汉字图片的部件识别方法,其特征在于该方法步骤如下:

步骤(1)、对汉字部件中的笔画和结构关系描述,标注构造统计结构模型所需要的信息;

步骤(2)、根据步骤(1)的汉字部件的标注结果,对输入的汉字图片中检测出的笔段进行有选择性的概率合并,生成可能匹配部件中标注笔画的可能笔画,称为候选笔画生成;

步骤(3)、根据步骤(2)中得到的可能匹配部件中标注好的笔画的候选笔画,寻找一组最优的候选笔画,基于目标部件生成可能的解;

步骤(4)、根据步骤(3)中得到的针对各个目标部件的可能解,利用动态规划思想,寻找可能部件的最优组合结果,作为汉字部件识别的结果。

2.根据权利要求1所述一种汉字图片的部件识别方法,其特征在于:所述步骤(1)中对汉字部件中的笔画和结构关系描述的具体内容如下:

步骤(A1)、对已经有的标准部件库中的514个汉字部件图片进行骨架提取处理,并检测特征点,所述特征点为笔画的端点和笔画之间的交叉点;通过这些特征点之间的连线得到初始笔段,从一个特征点通过骨架上的其他点找到另外一个特征点的路径,将这个路径记录称之为初始笔段;

步骤(A2)、通过人为的交互将所述初始笔段进行合并,得到标记好的汉字部件的笔画;对得到的汉字部件笔画进行Gabor特征的提取,描述汉字部件笔画的方向特征,将每一个笔画描述为一个4维向量和一个4*4协方差矩阵的高斯分布,完成汉字部件笔画的统计建模;

步骤(A3)、通过最大熵原理,利用近似结构关系进行邻居笔画的选取,近似结构关系即将汉字部件中一个笔画与其他所有笔画的结构关系近似为相对于自己邻居的结构关系,结构关系采用条件概率描述,即在某个笔画邻居被匹配后,该笔画匹配时需要采用条件概率计算,所述邻居笔画是指除了本身以外,汉字部件中其他笔画中对该笔画影响值最大的一个笔画,这个影响值通过两个协方差矩阵的差的模取对数描述;

步骤(A4)、计算互为邻居的两个邻居笔画局部特征,局部特征包括中心相对位置、长度比例和角度差,将这些计算好的局部特征的信息进行存储,以用来帮助识别输入的汉字部件。

3.根据权利要求1所述一种汉字图片的部件识别方法,其特征在于:所述步骤(2)部件候选笔画生成的步骤具体如下:

步骤(B1)、将输入汉字图片进行图像细化和骨架提取,检测特征点,如笔画之间的交叉点和笔画端点,通过寻找特征点之间的路径提取出初始笔段;

步骤(B2)、对某个目标部件进行识别时,将对应的部件的各个笔画得到,要计算的就是针对部件的每一个笔画,都会生成一组可能的解,这些解有可能是初始笔段,也有可能是一些初始笔段的组合结果,定义组合规则为两个笔段首尾相连且方向差不超过15°,或者其中一个笔段足够短小,这样就将两个笔段合成作为可能的笔画匹配解加入到候选笔画队列中。

4.根据权利要求1所述一种汉字图片的部件识别方法,其特征在于:所述步骤(3)中基于目标部件生成可能解的步骤如下:

步骤(C1)、构建搜索图,这张图的描述如下,每一列表示待匹配的部件的各个标注好的笔画,而某一列中的每一行都表示着对于这个部件的笔画的由输入汉字的初始笔段生成的候选笔画,这样将匹配问题转化成了一个图的搜索过程,要找一个每一列都找到一个点,从第一列找到最后一列的所有可行解中相似度最大的解。

步骤(C2)、图的搜索过程规则如下:第一,在匹配某一个笔画时,如果待匹配的候选笔画在对输入汉字的初始笔段占用上与前面已经选取的候选笔画相冲突,那么该候选笔画不能被选取;第二,在匹配某一个笔画时,如果作为这个笔画的邻居的笔画已经在前面的路径中被选取了,则要采用条件概率计算,并引入之前存储的局部特征信息,计算这个待匹配的候选笔画和前面已经匹配的候选笔画的中心相对位置关系、笔画长度比例,并和存储的局部特征信息相比较,描述局部特征的相似度。

5.根据权利要求1所述一种汉字图片的部件识别方法,其特征在于:所述步骤(4)中基于部件最优组合原理得到识别结果的步骤如下:

步骤(D1)、利用步骤(3)中得到的对于各个汉字部件生成的可能解,寻找最优的组合作为输入汉字部件识别结果;这样将部件识别问题描述为寻找一组最优的组合,使得组合中这些部件可能解在对输入汉字的初始笔段的占用上不冲突,且最大程度上的消耗掉输入汉字的初始笔段;定义这样的组合为输入汉字的最优的部件识别的结果;利用动态规划思想,将上述问题转化为一个背包问题,背包的容量为输入汉字的初始笔段数目,每一个可能的部件识别解都有一个标记数组来标记这个可能解对输入汉字的初始笔段的占用情况,这样相当于选取不冲突的几件物品放入背包中,使得背包尽可能的放满。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210454936.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top