[发明专利]一种手势识别方法、装置、计算机设备及存储介质有效
申请号: | 202110319068.6 | 申请日: | 2021-03-25 |
公开(公告)号: | CN113033398B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 严海兵;肖伟华;李振乐 | 申请(专利权)人: | 深圳市康冠商用科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06F3/01;G06K9/62;G06N3/04;G06N3/08;G06V10/774;G06V10/764 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
地址: | 518000 广东省深圳市龙岗区坂田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手势 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种手势识别方法,其特征在于,包括:
采集多张包含复杂背景的手势图,并对多张手势图进行预处理,构建得到包含多张训练手势图的手势数据集;
针对每一所述训练手势图,利用预先构建的手势检测网络进行手势区域检测和提取,得到第一手势区域;
所述手势检测网络依次包括数据层、第一中间卷积层、第一中间池化层、第二中间卷积层、第二中间池化层、第三中间卷积层、第三中间池化层、第四中间卷积层、第四中间池化层、第五中间卷积层、第五中间池化层、第六中间卷积层、第六中间池化层、第七中间卷积层、第八中间卷积层、第九中间卷积层、第十中间卷积层、输出卷积层,其中,所述数据层的输出为320×224×3,所述输出卷积层的卷积核个数为30个、卷积核大小为1×1、步长为1、输出为10×7×30;所述第七中间卷积层、第八中间卷积层、第九中间卷积层和第十中间卷积层的卷积核个数依次为1024、256、512和128,卷积核尺寸依次为3×3、1×1、3×3和1×1;
利用改进的全卷积神经网络对所述第一手势区域进行手势提纯处理,得到第二手势区域;
所述利用改进的全卷积神经网络对所述第一手势区域进行手势提纯处理,得到第二手势区域,包括:
将所述第一手势区域连续三次依次输入改进的全卷积神经网络的第一卷积层、激活层、最大池化层和局部归一化层,并输出第一特征,其中,所述第一卷积层的卷积核大小为3×3,步长为1;
将所述第一特征依次输入至改进的全卷积神经网络的第二卷积层和第三卷积层,并输出第二特征,其中,所述第二卷积层和第三卷积层的卷积核大小为1×1,所述第三卷积层的卷积核个数为2个;
对所述第二特征进行高低维特征融合,然后采用反卷积的方法对所述第二特征进行上采样,得到所述第二手势区域;
分别对所述第二手势区域提取Hu矩特征和Hog特征值,然后将所述Hu矩特征和Hog特征值进行融合,得到所述训练手势图对应的手势特征;
对所述手势特征进行降维处理,得到一特征文件;
基于SVM手势识别方法对所述特征文件进行模型训练,以构建得到手势识别模型;
利用所述手势识别模型对指定的手势图进行识别。
2.根据权利要求1所述的手势识别方法,其特征在于,所述针对每一所述训练手势图,利用预先构建的手势检测网络对所述训练手势图进行手势区域检测和提取,得到第一手势区域,包括:
将所述训练手势图划分为10×7的网格单元,其中每一网格单元的步长为32;
将包含所述训练手势图中手势区域中心位置的网格单元作为检测框;
基于所述检测框,按照下式对所述训练手势图的置信度进行计算:
式中,Cb表示置信度,P(Object)表示边界框包括手势的概率,表示预测框与真实框的交并比,其值介于0到1之间;
基于所述置信度确定所述训练手势图的第一手势区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市康冠商用科技有限公司,未经深圳市康冠商用科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110319068.6/1.html,转载请声明来源钻瓜专利网。