[发明专利]基于组合分类器的手写识别方法无效
| 申请号: | 200810062115.8 | 申请日: | 2008-05-29 |
| 公开(公告)号: | CN101290659A | 公开(公告)日: | 2008-10-22 |
| 发明(设计)人: | 何加铭;沈钱波;贾德祥;杨任尔;曾兴斌 | 申请(专利权)人: | 宁波新然电子信息科技发展有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/36;G06K9/46 |
| 代理公司: | 宁波海曙奥圣专利代理事务所 | 代理人: | 程晓明 |
| 地址: | 315010浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 组合 分类 手写 识别 方法 | ||
1.一种基于组合分类器的手写汉字识别方法,该方法包括以下步骤:第①步,接收书写在手写输入设备的用户接口上的手写输入汉字;第②步,对手写输入汉字进行预处理;第③步,从预处理后的手写输入汉字中提取汉字的特征向量;第④步,将汉字的特征向量通过组合分类器与模型汉字进行对比识别,并确定匹配的候选汉字;其特征在于在所述的第②步中的预处理中增加离群点剔除处理,使所述的第②步的具体步骤为:第②-1步,对采集到的手写输入汉字的笔段进行平滑滤波、噪声剔除和重采样处理;第②-2步,对经过第②-1步处理后得到的手写输入汉字的笔段进行数据线性归一化处理;第②-3步,对数据线性归一化处理后得到的手写输入汉字进行离群点剔除处理,所述的离群点为偏离所述的手写输入汉字的笔段大于设定的阈值的点;所述的第③步中的汉字的特征向量包括笔段特征向量和整字特征向量,所述的笔段特征向量的提取的具体步骤如下:第③-1步,建立基本笔段类型及与基本笔段类型相对应的参数特征,所述的基本笔段类型包括横、竖、撇、捺、提、勾和点,所述的参数特征包括采样点的时间间隔、笔段方向和笔段长度;第③-2步,提取预处理后的手写输入汉字的笔段;第③-3步,根据提取的手写输入汉字的笔段与笔段的连接状态建立前后笔段的连接关系,所述的连接关系包括相连、相交和相离;再根据手写输入汉字的笔段的类型和前后笔段的连接关系去除部分无效笔段;所述的相连包括前笔段起点与后笔段起点相连、前笔段起点与后笔段终点相连、前笔段终点与后笔段起点相连、前笔段终点与后笔段终点相连、前笔段中间点与后笔段起点相连、前笔段起点与后笔段中间点相连、前笔段终点与后笔段中间点相连和前笔段中间点与后笔段终点相连;所述的相交包括中间点与中间点相交;所述的相离包括相邻笔段之间的相离和实际相连书写相离;第③-4步,根据提取的手写输入汉字的笔段,判断笔段是否有违反书写方法,如果违反了书写方法,则自动删除该笔段,否则,对该笔段不作处理;所述的整字特征向量的提取的具体步骤如下:将手写输入汉字的各笔段端点相连后求取Freeman链码,将Freeman链码确定为一组观测序列。
2.根据权利要求1所述的基于组合分类器的手写汉字识别方法,其特征在于所述的第③-4步中的所述的书写方法的具体定义如下:左至右为横,上至下为竖,右至左、上至下为撇,左至右、上至下为捺或点,左至右、下至上为提,右至左、下至上为勾。
3.根据权利要求1所述的基于组合分类器的手写汉字识别方法,其特征在于所述的第④步中的所述的组合分类器包括笔段识别分类器和整字识别分类器,所述的笔段识别分类器采用三层RBF神经网络,所述的RBF神经网络中的第一层为输入层、第二层为隐含层和第三层为输出层,所述的输入层实现所述的输入层到的所述的隐含层的非线性映射,所述的输出层实现所述的隐含层到所述的输出层的线性映射;所述的整字识别分类器首先通过收集手写输入汉字的样本,为每个手写输入汉字训练得到HMM模型;识别时提取手写输入汉字的观测序列;然后利用forward算法,计算该观测序列在字库中每个汉字的HMM模型中的概率,并选取概率最大的汉字确定为识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波新然电子信息科技发展有限公司,未经宁波新然电子信息科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810062115.8/1.html,转载请声明来源钻瓜专利网。





