[发明专利]一种基于密度峰值聚类特征选择的三维手写字符识别方法有效
| 申请号: | 202010467270.9 | 申请日: | 2020-05-28 |
| 公开(公告)号: | CN111709320B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 张钰;王葵 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V10/762;G06V10/764 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 黄前泽 |
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 密度 峰值 特征 选择 三维 手写 字符 识别 方法 | ||
1.一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤一、建立数据集,数据集包括m个手写字符的三维离散点集;
步骤二、将m个三维离散点集各自依序连接,得到m个手写字符的三维轨迹;
步骤三、对m个三维离散点集分别进行预处理;
步骤四、对预处理后的三维离散点集提取特征,特征分成三大类,分别是书写方向,曲率,坐标差,共计16个特征,具体如下:
4.1、三维离散点集中任意点的书写方向对应三个特征,分别为其相邻两点的连线与x轴、y轴、z轴夹角的余弦值;
4.2、三维离散点集中任意点的书写方向对应十个特征,分别为该点与相邻两点所成圆的圆心坐标、半径、圆心到相邻两点连线中点的向量坐标、圆心到该点与下一点连线中点的向量坐标;
4.3、三维离散点集中任意点的曲率特征对应三个特征,分别为其相邻两点的x轴、y轴、z轴的坐标差值;
步骤五、计算任意两个特征间的对称不确定性;第i个特征Xi与第j个特征Xj之间的对称不确定性SU(Xi,Xj)的表达式如式(4)所示;i=1,2,…,16;j=1,2,…,16;
式(4)中,H(Xi)、H(Xj)分别是特征Xi、Xj的信息熵,其表达式如式(5)所示;IG(Xi,Xj)表示特征Xi与特征Xj的信息增益,其表达式如式(6)所示;
H(Xi)=-∑p(xik)log2(p(xik)) 式(5)
式(5)中,p(xik)表示特征Xi第k个取值xik对应的概率;
IG(Xi,Xj)=H(Xi)-H(Xi|Xj) 式(6)
式(6)中,H(Xi|Xj)是条件熵,其表达式如式(7)所示;
H(Xi|Xj)=-∑p(xjl)∑p(xik|xjl)log2(p(xik|xjl)) 式(7)
式(7)中,p(xik|xjl)表示特征Xj取第l个值xjl时,特征Xi取第k个值xik的概率;
步骤六、计算第i个特征的局部密度;第i个特征的局部密度ρi的表达式如式(8)所示;i=1,2,…,16;
式(8)中,1/SUij是特征Xi和特征Xj的称为距离,即对称不确定性的倒数,dc是截断距离;χ(x)是逻辑判断函数,其表达式如式(9)所示;
步骤七、分别计算各个特征对应的高密度特征距离
对16个特征按照局部密度的大小以升序重新排序;除局部密度最大的特征外,任意一个特征Xi的高密度特征距离(δi)1≤i≤15表示特征Xi与局部密度高于特征Xi的各个特征中局部密度最小的特征Xj之间的距离,其表达式如式(10)所示;i=1,2,…,15;
局部密度最大的特征Xi的高密度特征距离(δi)i=16表示该特征Xi与其他各特征的距离的最大值,其表达式如式(11)所示;
步骤八、计算各特征的加权后的局部密度ρi与加权后的高密度特征距离δi的乘积,作为该特征的中心指标γi,具体表达式如式(12)所示;
γi=ρiω·(δi)(1-ω) 式(12)
式(12)中,ω为局部密度对应的权重;
步骤九、将各个特征按照中心指标γi的大小进行降序排列;选择前a个特征为聚类中心;a为识别特征数;
步骤十、使用者进行三维手写字符采集,得到三维点集;对所得的三维点集进行特征提取,提取出与步骤九所得a个聚类中心相对应的特征值;根据该a个特征值,通过决策树模型识别出被测三维手写字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010467270.9/1.html,转载请声明来源钻瓜专利网。





