[发明专利]一种基于多尺度卷积神经网络的静态手势识别方法在审
申请号: | 201710540178.9 | 申请日: | 2017-07-05 |
公开(公告)号: | CN109214250A | 公开(公告)日: | 2019-01-15 |
发明(设计)人: | 谢斌;宋迪;喻仲斌 | 申请(专利权)人: | 中南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 多尺度 静态手势识别 提取特征 训练数据 手势 预处理 输入测试数据 测试数据 尺度特征 复杂背景 技术原理 神经网络 实验测试 手势特征 图片数据 图像处理 网络结构 优化设计 自动学习 放入 卷积 样本 精细 采集 测试 学习 图片 | ||
1.一种基于多尺度卷积神经网络的静态手势识别方法,其特征在于,包括:
基于图像处理与深度学习结合的方法,设计出一种基于多尺度卷积神经网络的静态手势识别方法;通过多层的特征提取,多尺度卷积神经网络利用低层、中层和高层图像特征进行图像分类识别,使得图像的分类识别能够更加精细化,计算量不大,优于单尺度卷积神经网络。
2.根据权利要求1所述的方法,其特征在于,所述静态手势识别方法的方案步骤包括:
1)对于简单背景下和复杂背景下的静态手势图片数据进行采集与预处理,数据分为训练数据与测试数据;
2)在获得了数据之后进行实验测试环境的搭建,分为硬件与软件的搭建;
3)其次进行基于多尺度的卷积神经网络的设计,即:确定神经网络层数,选择合适的尺度特征,避免过拟合;
4)然后把经过标记的训练数据放入此网络结构中进行学习;
5)最后输入测试数据样本进行测试;
6)得出最后的静态手势识别精度。
3.根据权利要求2所述的方法,其特征在于,所述手势样本采集包括:
采用Sebastien Marcel静态手势数据集并进行了扩充;该静态手势集定义了复杂背景和简单背景下的6个手势。
4.根据权利要求2所述的方法,其特征在于,所述图像预处理包括:
为了更好使用卷积神经网络进行手势识别,统一将数据图片缩放为固定尺寸;为了减少计算量与运行时间,需将图片进行灰度化处理。
5.根据权利要求2所述的方法,其特征在于,所述测试实验环境的搭建包括:
硬件环境是采用Nvidia的GTX1060显卡和Intel的6代i7处理器,软件环境采用的Ubuntu16.04系统和伯克利视觉和学习中心(BVLC)开发的Caffe框架;Caffe框架具有灵活的框架结构与良好的性能。
6.根据权利要求2所述的方法,其特征在于,所述多尺度卷积神经网络的设计包括:
1)基于卷积层:卷积神经网络与普通神经网络最大的不同在于卷积神经网络拥有卷积层,能够直接对输入图片进行图像特征提取;在一个卷积层中通常有多个卷积核,每一个卷积核对应输出一张特征图;
2)基于池化层:池化层是对卷积层输出的特征图进行下采样计算,但仍然保留图中最重要的信息;池化的方法有:最大值池化,平均值池化;池化可减少特征图的维度、网络对能存的消耗、神经网络中的参数数量、计算量;图像中平移、失真等影响;
3)基于全连层:全连接层相当于传统的多层感知器;在全连接层中,每个神经元都与前一层的每个神经元相连;输入图像经过多层的卷积、池化操作,再与全连接层相连时已经呈现出高层特征,全连接层使用这些高层特征进行图像分类;
4)基于多尺度:多尺度在机器视觉中是一个比较经典的概念,通过多层的特征提取,多尺度卷积神经网络能够利用低层、中层和高层图像特征进行图像分类识别,使得图像的分类识别能够更加精细化,而且没有给神经网络增加很大的计算量;此网络结构的设计主要有三个难点,第一、神经网络层数的确定;第二、尺度特征的选择;第三、如何避免过拟合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710540178.9/1.html,转载请声明来源钻瓜专利网。