首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于并联卷积神经网络的手势估计方法有效

申请号：	201710575403.2	申请日：	2017-07-14
公开（公告）号：	CN107423698B	公开（公告）日：	2019-11-22
发明（设计）人：	胡友民;胡中旭;吴波;刘颉;肖玲;王诗杰;李雪莲;武敏健	申请（专利权）人：	华中科技大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06T7/207
代理公司：	42201 华中科技大学专利中心	代理人：	周磊;曹葆青<国际申请>=<国际公布>=
地址：	430074 湖北***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于并联卷积神经网络手势估计方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于并联卷积神经网络的手势估计方法，其特征在于，包括以下步骤：

S1、图像获取：采用RGB-D相机获得彩色图像和深度图像；

S2、图像分割：根据预先训练得到的手部分类模块，在彩色图像上识别出手部所在的位置；

S3、手部深度图获取：根据手部在彩色图像上对应的位置，找到其在深度图像上对应的位置，然后将手部深度图分离出来；

S4、手势估计：将分离出的深度图转化为灰度图，然后将灰度图输入并联卷积神经网络手势估计模块进行识别，从而获得能够表示手部姿态的多个关节点坐标，其中，手势估计模块通过下述步骤获得：

1)、收集含有标注的手部深度图，采用了公开数据集，该公开数据集含有选定的标注好的手部深度图；

2)、采用数据增强的方式，扩充训练集；

3)、设计并联的深度卷积神经网络结构：该网络结构由深层网络和浅层网络并联形成，深层网络决定了网络的精确度，浅层网络决定网络的收敛速度；

4)、网络的目标函数J如式(1)，训练目标是求解最优的网络权重值w，以使目标函数J的值最小；

其中，x_i为训练样本,y_i为训练样本对应的标签值，N为训练样本的个数，λ为惩罚系数，f(x_i)是训练样本x_i对应的网络预测值，w是网络权重，||w||₂为权重w的L2范数；

5)、网络训练算法采用随机梯度下降，将训练集分为多个小集合，每次随机无放回的抽取一个小集合的样本将其送入网络，求解目标函数得到的误差，然后利用反向传播算法将误差回传到每一层，再通过梯度下降算法更新权重，这样重复多次可将全部样本抽取一遍，称之为一个周期，最终训练多个周期；

6)、将最终训练得到的网络权重保存起来，即可得到训练好的手势估计模块；

S5、结果输出：输出手势结果。

2.根据权利要求1所述的一种基于并联卷积神经网络的手势估计方法，其特征在于，步骤S2中，利用训练得到的手部分类模块的识别手部位置的过程具体如下：

1)、构建图像金字塔，从而获得多幅彩色图像，然后获取各彩色图像的梯度信息；

2)、固定选取框以固定步长分别扫描每幅彩色图像，每经过一处，计算统计当前框内的HOG特征；

3)、将得到的HOG特征输入训练好的手部分类模块中进行扫描识别，保存识别的手部特征；

4)、扫描识别完成后，得到一组选取框的坐标值，采用最大化抑制合并重叠的选取框，最终得到含有手部的扫描框，从而完成图像分割。

3.根据权利要求1所述的一种基于并联卷积神经网络的手势估计方法，其特征在于，步骤S2中，手部分类模块通过以下步骤训练获得：

1)、收集含有手部的图片，且手部占图片的面积大约80％以上，然后再收集若干背景图片；

2)、计算收集到图片的HOG特征，然后含有手部的为正例，背景图为反例；

3)、采用支持向量机进行训练，求最优化的权重和偏置，最终得到训练好的手部分类模块。

4.根据权利要求1所述的一种基于并联卷积神经网络的手势估计方法，其特征在于，步骤3)中网络结构的输出层采用的输出函数为：

其中，x为输入量，L为阈值常数，α和β分别为函数系数并且两者取值范围均为0到1，而且均随着训练过程而衰减。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华中科技大学，未经华中科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710575403.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种天然气燃烧炉的炉盖
下一篇：一种燃烧器火盖、燃烧器及燃气灶

同类专利

专利分类

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top