[发明专利]一种汉字图片的部件识别方法有效

专利信息
申请号: 201210454936.2 申请日: 2012-11-13
公开(公告)号: CN102968619A 公开(公告)日: 2013-03-13
发明(设计)人: 梁晓辉;于博文;孙林嘉 申请(专利权)人: 北京航空航天大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46;G06K9/62
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 成金玉;贾玉忠
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 汉字 图片 部件 识别 方法
【说明书】:

技术领域

发明属于计算机虚拟现实技术领域,特别是汉字图片的骨架提取、笔段生成的图像处理领域以及基于语义知识的部件识别的模式识别领域。

背景技术

作为表意文字的典型代表,中文书写和语音文字书写有较大的差别。象形文集结构研究表示,组成汉字的有着明确含义的各个部分被定义为部件,而汉字可以看成是由各个部件通过不同的组合方式组合而成。利用,像“桃”和“李”两个字,他们之中都有一个“木”的部件,实际上代表着有树的意思。因此,如何将一个汉字拆分成各个具有具体语义信息的部件的组合成为汉字学习中一个比较重要的部分。

目前,汉字图片的识别大致可以分为两类,基于统计方法和基于结构方法两种。基于统计的方法倾向于利用图片的图像特征,如像素布局等,将汉字的识别转换成目标图片与标准库图片的相似度计算。而结构识别方法倾向于描述汉字的结构关系和汉字的笔画特征,如利用笔画间的夹角、相对位置关系来描述结构,最后通过总体结构的相似度计算完成识别。

利用统计方法解决汉字识别问题,当前已经有了许多的研究工作。例如,k近邻分类器、k均值聚类、高斯分布、非线性形状模型以及上下文向量法。基于统计特征的方法是速度较快,且对噪声的抵抗能力较强,但对于像“王”和“玉”这样结构相近的两个字容易造成识别上的错误。

而结构方法倾向于将汉字分解为各个部分,通过对拆分出的部分的分析,进而得到识别的结果。可以用来表征汉字结构的常用的特征有轮廓、笔画等。事实上,对于结构识别而言,其实质实际上就是一个笔画匹配的过程。结构方法的特点就是可以区分细小的差别,从而识别出结构相似的不同汉字,但识别速度会有所限制。

发明内容

本发明的技术解决问题:克服现有技术的不足,提供一种汉字图片的部件识别方法,能够有效的提高识别率。

本发明技术解决方案:一种汉字图片的部件识别方法,实现步骤如下:

步骤(1)、汉字部件的笔画与结构关系描述:对已经有的标准的汉字514个部件图片进行骨架提取处理,并检测特征点,这里描述的特征点为笔画的端点和笔画之间的交叉点,这样可以通过这些特征点之间的连线来检测初始笔段;从一个特征点通过骨架上的其他点找到另外一个特征点的路径,将这个路径记录称之为初始笔段,所述特征点定义为交叉点或者是端点;然后通过人为的交互将所述初始笔段进行合并,得到标记好的汉字部件的笔画;对得到的部件笔画进行Gabor特征的提取,描述汉字部件笔画的方向特征,将每一个笔画描述为一个4维向量和一个4*4协方差矩阵的高斯分布,完成笔画的统计建模;通过最大熵原理,邻居笔画的选取可以让近似结构关系,即将部件中一个笔画与其他所有笔画的结构关系近似为相对于自己邻居的结构关系,这里的结构关系可以用条件概率描述,即在某个笔画邻居被匹配后,该笔画匹配时需要采用条件概率计算,所述邻居笔画是指除了本身以外,汉字部件中其他笔画中对该笔画影响值最大的一个笔画,这个影响值通过两个协方差矩阵的差的模取对数描述;然后提取互为邻居的两个笔画局部特征,所述局部特征为两个互为邻居的笔画的中心相对位置、长度比例和角度差,将这些计算好的局部特征的信息进行存储,这里所做的部件笔画标注和特征提取可以用来帮助识别输入汉字中的部件;

步骤(2)、部件候选笔画生成:对输入的汉字图片进行图像细化和骨架提取之后,检测细化和骨架提取之后的图片中的端点和交叉点作为特征点,通过寻找特征点间通过骨架的连线来寻找初始笔段,检测出初始笔段后,针对待匹配的部件的某个笔画,概率组合这些初始笔段,形成可能匹配对应部件这个笔画的一组笔画,称之为候选笔画(由初始笔段针对待匹配部件的对应笔画组合而成),之后便可以利用这些候选笔画去和目标部件的合并好的笔画进行匹配;

步骤(3)、基于目标部件生成可能解:重复的利用步骤2的方法,对步骤1中初始笔段合并为笔画做匹配,对于库中每一个部件,都得到一个可能的部件匹配的解,即针对各个部件生成可能解,这个匹配过程描述为一个矩阵,每一列表示目标部件中的各个笔画,某一列的每一行都存储着依据步骤(2)中方法得到的目标部件笔画的候选笔画,整个匹配过程就是寻找一个从第一列找到最后一列,每一列都找到一个可行节点的解中相似度最大的值,从而将得到输入汉字图片,对于库中所有部件生成的最可能匹配的结果;所述相似度描述为每一个笔画匹配时的由高斯函数计算出的概率值的累积。利用上述的方法,对于输入汉字的提取出的所有初始笔段,可以寻找到针对部件库中每一个部件的最可能的匹配解,为后续的步骤4的算法提供数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210454936.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top