[发明专利]一种基于多尺度卷积神经网络的静态手势识别方法在审

申请号：	201710540178.9	申请日：	2017-07-05
公开（公告）号：	CN109214250A	公开（公告）日：	2019-01-15
发明（设计）人：	谢斌;宋迪;喻仲斌	申请（专利权）人：	中南大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	410083 湖南***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	卷积神经网络多尺度静态手势识别提取特征训练数据手势预处理输入测试数据测试数据尺度特征复杂背景技术原理神经网络实验测试手势特征图片数据图像处理网络结构优化设计自动学习放入卷积样本精细采集测试学习图片
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多尺度卷积神经网络的静态手势识别方法，其特征在于，包括：

基于图像处理与深度学习结合的方法，设计出一种基于多尺度卷积神经网络的静态手势识别方法；通过多层的特征提取，多尺度卷积神经网络利用低层、中层和高层图像特征进行图像分类识别，使得图像的分类识别能够更加精细化，计算量不大，优于单尺度卷积神经网络。

2.根据权利要求1所述的方法，其特征在于，所述静态手势识别方法的方案步骤包括：

1)对于简单背景下和复杂背景下的静态手势图片数据进行采集与预处理，数据分为训练数据与测试数据；

2)在获得了数据之后进行实验测试环境的搭建，分为硬件与软件的搭建；

3)其次进行基于多尺度的卷积神经网络的设计，即：确定神经网络层数，选择合适的尺度特征，避免过拟合；

4)然后把经过标记的训练数据放入此网络结构中进行学习；

5)最后输入测试数据样本进行测试；

6)得出最后的静态手势识别精度。

3.根据权利要求2所述的方法，其特征在于，所述手势样本采集包括：

采用Sebastien Marcel静态手势数据集并进行了扩充；该静态手势集定义了复杂背景和简单背景下的6个手势。

4.根据权利要求2所述的方法，其特征在于，所述图像预处理包括：

为了更好使用卷积神经网络进行手势识别，统一将数据图片缩放为固定尺寸；为了减少计算量与运行时间，需将图片进行灰度化处理。

5.根据权利要求2所述的方法，其特征在于，所述测试实验环境的搭建包括：

硬件环境是采用Nvidia的GTX1060显卡和Intel的6代i7处理器，软件环境采用的Ubuntu16.04系统和伯克利视觉和学习中心(BVLC)开发的Caffe框架；Caffe框架具有灵活的框架结构与良好的性能。

6.根据权利要求2所述的方法，其特征在于，所述多尺度卷积神经网络的设计包括：

1)基于卷积层：卷积神经网络与普通神经网络最大的不同在于卷积神经网络拥有卷积层，能够直接对输入图片进行图像特征提取；在一个卷积层中通常有多个卷积核，每一个卷积核对应输出一张特征图；

2)基于池化层：池化层是对卷积层输出的特征图进行下采样计算，但仍然保留图中最重要的信息；池化的方法有：最大值池化，平均值池化；池化可减少特征图的维度、网络对能存的消耗、神经网络中的参数数量、计算量；图像中平移、失真等影响；

3)基于全连层：全连接层相当于传统的多层感知器；在全连接层中，每个神经元都与前一层的每个神经元相连；输入图像经过多层的卷积、池化操作，再与全连接层相连时已经呈现出高层特征，全连接层使用这些高层特征进行图像分类；

4)基于多尺度：多尺度在机器视觉中是一个比较经典的概念，通过多层的特征提取，多尺度卷积神经网络能够利用低层、中层和高层图像特征进行图像分类识别，使得图像的分类识别能够更加精细化，而且没有给神经网络增加很大的计算量；此网络结构的设计主要有三个难点，第一、神经网络层数的确定；第二、尺度特征的选择；第三、如何避免过拟合。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中南大学，未经中南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710540178.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种用于安保监控系统的智能视频分析方法
下一篇：一种指纹感测电路及指纹感测装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多尺度卷积神经网络的静态手势识别方法在审

专利文献下载