[发明专利]一种基于密度峰值聚类特征选择的三维手写字符识别方法有效
| 申请号: | 202010467270.9 | 申请日: | 2020-05-28 |
| 公开(公告)号: | CN111709320B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 张钰;王葵 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V10/762;G06V10/764 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 黄前泽 |
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 密度 峰值 特征 选择 三维 手写 字符 识别 方法 | ||
本发明公开了一种基于密度峰值聚类特征选择的三维手写字符识别方法。现有的三维手写字符识别方法没有充分考虑冗余特征对字符识别率的影响。本发明如下:一、采集运动指尖的三维坐标并生成离散点集。二、顺序连接离散点生成三维轨迹。三、预处理。四、提取书写方向,曲率,坐标差值三大类特征。五、利用对称不确定性的倒数1/SU衡量特征间的相似性。六、利用密度峰值聚类算法的定义计算局部密度ρ。七、根据密度峰值聚类算法计算与高密度特征的距离。八、计算局部密度。九、将γ按降序排列,选取聚类中心。十、基于十折交叉验证方法和决策树算法模型,得到最终的识别率。本发明可以在特征减少,计算量降低的情况下,识别率还能提高。
技术领域
本发明属于三维手写字符识别领域,具体涉及一种基于密度峰值聚类特征选择的三维手写字符识别方法。
背景技术
手写字符识别技术是借助PC机对一组手写字符进行分类,然后输出分类结果的技术,它是模式识别中的一个重要部分,也是光学识别领域的一个不可或缺的分支。但是由于手写字符的随意性,导致手写字符识别很难,有时人工识别也达不到100%的精度,但是很多应用方面都要求较高的识别率。
传统的二维手写字符是依靠纸笔,或者用手指在触摸屏上书写等方式完成的,这些方式需要物理平面的支撑,且手指会受到束缚。但随着深度传感器的发展,使得在三维空间中进行书写成为可能。但由于在三维空间中书写更加自由,导致三维手写字符识别更加困难,所以特征的选取尤其重要。目前已有不少特征描述方法用于三维手写字符识别算法,但这些算法大多没有考虑到提取的特征间存在冗余,而冗余特征的存在不仅会加大计算量,还会影响到识别率。因此,提出一种关于三维手写字符特征选择的方法具有重要意义。
发明内容
本发明主要是针对现有三维手写字符识别方法存在的不足,提出一种基于密度峰值聚类特征选择的三维手写字符识别方法。该方法主要解决三维手写字符识别中存在冗余特征的问题,适用于不同书写习惯的人群,并且该方法可以在减少特征的前提下,提高三维手写字符的识别率。
本发明的具体步骤如下:
步骤一、建立数据集,数据集包括m个手写字符的三维离散点集;
步骤二、将m个三维离散点集各自依序连接,得到m个手写字符的三维轨迹。
步骤三、对m个三维离散点集分别进行预处理。
步骤四、对预处理后的三维离散点集提取特征,特征分成三大类,分别是书写方向,曲率,坐标差,共计16个特征,具体如下:
4.1、三维离散点集中任意点的书写方向对应三个特征,分别为其相邻两点的连线与x轴、y轴、z轴夹角的余弦值。
4.2、三维离散点集中任意点的书写方向对应十个特征,分别为该点与相邻两点所成圆的圆心坐标、半径、圆心到相邻两点连线中点的向量坐标、圆心到改点与下一点连线中点的向量坐标。
4.3、三维离散点集中任意点的曲率特征对应三个特征,分别为其相邻两点的x轴、y轴、z轴的坐标差值。
步骤五、计算任意两个特征间的对称不确定性;第i个特征Xi与第j个特征Xj之间的对称不确定性SU(Xi,Xj)的表达式如式(4)所示。i=1,2,…,16;j=1,2,…,16;
式(4)中,H(Xi)、H(Xj)分别是特征Xi、Xj的信息熵,其表达式如式(5)所示。IG(Xi,Xj)表示特征Xi与特征Xj的信息增益,其表达式如式(6)所示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010467270.9/2.html,转载请声明来源钻瓜专利网。





