[发明专利]基于混合特征提取的手写数字识别方法有效
| 申请号: | 201611078514.4 | 申请日: | 2016-11-29 |
| 公开(公告)号: | CN107067046B | 公开(公告)日: | 2020-09-04 |
| 发明(设计)人: | 王蕾 | 申请(专利权)人: | 南京工程学院 |
| 主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/62 |
| 代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
| 地址: | 211167 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 混合 特征 提取 手写 数字 识别 方法 | ||
1.一种基于混合特征提取的手写数字识别方法,其特征在于:包括以下步骤,
S1、手写数字信息获取,对温度阵列手写数字输入终端进行手写数字信息的采集、预处理,随着手写数字的书写,通过温度阵列手写数字输入终端采集到的数据帧的值的分布随之变化,判断落笔时刻和起笔时刻,消除无效数据帧;其中,基于温度阵列手写数字输入终端的手写数字信息的获取与预处理,具体步骤如下:
S11、计算机通过串口采集温度阵列手写数字输入终端的手写输入数据帧,并根据数据帧中温度的变化特征,去掉落笔前和起笔后的无效帧;
S12、当一个数字书写完成后,将得到的多帧数据进行去噪处理,然后加权平均,得到一个手写数字的静态数据帧;
S2、手写数字混合特征提取,根据温度变化信息,对手指尖运动轨迹进行跟踪检测,在获得跟踪轨迹的基础上,提取手写数字的动态特征;同时对采集到的一个数字的多帧数据进行平均求和后,提取反映手写数字结构、比划特征的静态特征;由此得到包括静态特征和动态特征的混合特征向量;
步骤S2中,动态特征提取步骤如下:首先,建立手写数字动态特征库,并给出每个特征的定义;其次,建立手写数字动态特征识别规则库;再次,用测试样本集对识别规则库进行测试,根据测试结果对特征和规则进行调整,直到测试样本正确识别率达到98%为止;最后,根据测试结果得出最优的动态特征;
步骤S2中,提取手写数字的六个动态特征,分别为:特征一:起笔点与落笔点之间的距离;特征二:起笔点到落笔点的矢量方向;特征三:每个笔划矢量角度的代数和;特征四:相邻两笔划矢量的夹角;特征五:相邻两笔划矢量夹角绝对值的最大值;特征六:所有笔划矢量旋转方向的变化次数;
S3、手写数字特征选择,对步骤S2得到的动态特征和静态特征进行分析,对混合特征向量归一化处理后,采用主分量分析法进行特征选择,选择能反映手写数字本质特征的主分量,构成手写数字的特征向量;
S4、手写数字识别,将步骤S3得到手写数字的特征向量用于支持向量机SVM分类器的训练或分类,实现对手写数字的识别。
2.如权利要求1所述的基于混合特征提取的手写数字识别方法,其特征在于:步骤S2中,采用粗网格特征提取方法提取手写数字的温度分布特征,即静态特征,首先对一个数字的多帧数据进行求和平均,然后把平均数据帧中的矩阵分成几个局部小区域,把每个小区域上的点阵密度作为描述特征,即统计每个小区域中图像像素所占百分比作为特征数据。
3.如权利要求1所述的基于混合特征提取的手写数字识别方法,其特征在于:步骤S3进行手写数字特征选择,具体为:
假设xi为第i个输入样本,用列向量表示,输入样本为
X=(x1,x2,…,xN) (1)
S31、计算输入样本中所有的混合特征向量的平均向量;
其中,N为输入样本的样本数量;
S32、计算输入样本中每个特征向量与平均向量的向量差;
S33、计算输入样本中特征向量的协方差矩阵;
式中,D=[d1,d2,…,di…,dN],i为1到N间的一个整数;T表示向量转置;
S34、采用奇异值分解方法计算测试样本特征向量协方差矩阵的非零特征值λj,及其对应的特征向量uj,j为1到r间的一个整数由此得到特征子空间为
U=[u1,u2,…,uj,…,ur] (4)
式中,r为选择的主特征向量的数目;
S35、将训练样本或测试样本投影到特征子空间,即可得到被选择的特征向量:
Pi=UTdi (5)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611078514.4/1.html,转载请声明来源钻瓜专利网。





