[发明专利]一种基于并联卷积神经网络的手势估计方法有效
申请号: | 201710575403.2 | 申请日: | 2017-07-14 |
公开(公告)号: | CN107423698B | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 胡友民;胡中旭;吴波;刘颉;肖玲;王诗杰;李雪莲;武敏健 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T7/207 |
代理公司: | 42201 华中科技大学专利中心 | 代理人: | 周磊;曹葆青<国际申请>=<国际公布>= |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于自动识别技术领域,并公开了一种基于并联卷积神经网络的手势估计方法,包括以下步骤:S1、采用RGB‑D相机获得彩色图像和深度图像;S2、根据预先训练得到的手部分类模块,在彩色图像上识别出手部所在的位置;S3、根据手部在彩色图像上对应的位置,找到其在深度图像上对应的位置,然后将手部深度图分离出来;S4、将分离出的深度图转化为灰度图,然后将灰度图输入并联卷积神经网络手势估计模块进行识别,从而获得能够表示手部姿态的多个关节点坐标;S5、输出手势结果。本发明提供了一种端到端的手势估计网络架构,降低了算法的复杂度,并联结构极大提高了网络收敛速度,极大节省了训练时间,提高了效率。 | ||
搜索关键词: | 一种 基于 并联 卷积 神经网络 手势 估计 方法 | ||
【主权项】:
1.一种基于并联卷积神经网络的手势估计方法,其特征在于,包括以下步骤:/nS1、图像获取:采用RGB-D相机获得彩色图像和深度图像;/nS2、图像分割:根据预先训练得到的手部分类模块,在彩色图像上识别出手部所在的位置;/nS3、手部深度图获取:根据手部在彩色图像上对应的位置,找到其在深度图像上对应的位置,然后将手部深度图分离出来;/nS4、手势估计:将分离出的深度图转化为灰度图,然后将灰度图输入并联卷积神经网络手势估计模块进行识别,从而获得能够表示手部姿态的多个关节点坐标,其中,手势估计模块通过下述步骤获得:/n1)、收集含有标注的手部深度图,采用了公开数据集,该公开数据集含有选定的标注好的手部深度图;/n2)、采用数据增强的方式,扩充训练集;/n3)、设计并联的深度卷积神经网络结构:该网络结构由深层网络和浅层网络并联形成,深层网络决定了网络的精确度,浅层网络决定网络的收敛速度;/n4)、网络的目标函数J如式(1),训练目标是求解最优的网络权重值w,以使目标函数J的值最小;/n /n其中,xi为训练样本,yi为训练样本对应的标签值,N为训练样本的个数,λ为惩罚系数,f(xi)是训练样本xi对应的网络预测值,w是网络权重,||w||2为权重w的L2范数;/n5)、网络训练算法采用随机梯度下降,将训练集分为多个小集合,每次随机无放回的抽取一个小集合的样本将其送入网络,求解目标函数得到的误差,然后利用反向传播算法将误差回传到每一层,再通过梯度下降算法更新权重,这样重复多次可将全部样本抽取一遍,称之为一个周期,最终训练多个周期;/n6)、将最终训练得到的网络权重保存起来,即可得到训练好的手势估计模块;/nS5、结果输出:输出手势结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710575403.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种天然气燃烧炉的炉盖
- 下一篇:一种燃烧器火盖、燃烧器及燃气灶