[发明专利]一种基于3D卷积神经网络的头部姿态估计方法在审
| 申请号: | 201910530482.4 | 申请日: | 2019-06-19 |
| 公开(公告)号: | CN110210456A | 公开(公告)日: | 2019-09-06 |
| 发明(设计)人: | 曾凯;张志聪 | 申请(专利权)人: | 贵州理工学院 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 贵阳中工知识产权代理事务所 52106 | 代理人: | 王蕊 |
| 地址: | 550000 *** | 国省代码: | 贵州;52 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 头部姿态 池化 卷积 卷积神经网络 两路 模式识别领域 垂直水平 叠加处理 角度转换 平面坐标 头部转动 网络结构 层合并 输入层 坐标点 构建 转动 合并 输出 表现 网络 学习 | ||
1.一种基于 3D 卷积神经网络的头部姿态估计方法,其特征在于该方法包括:
步骤1:将头部姿态定义为9类;通过对同类2D图片叠加的方式对原始头部姿态图片进行预处理;
步骤2:使用步骤1获得的训练样本训练3D卷积神经网络
步骤2.1:输入立方体经过卷积计算,为C1卷积层;
步骤2.2:对步骤2.1输出的特征图立方体,通过两路不同的卷积核做卷积计算,连续重复两次,为网络的C2、C3卷积层;
步骤2.3:对步骤2.2输出的特征立方体图进行合并做卷积计算,再做平均池化计算,为网络的C4卷积层;
步骤2.4:对步骤2.3输出的特征立方体图形,通过两路不同的卷积核做卷积计算,连续两次,并在C6卷积层卷积运算后进行最大池化运算,为网络的C5、C6卷积层;
步骤2.5:对步骤2.4输出的特征图立方体,分为通过两路相同的全连接层,做全连接计算,为F1全连接层;
步骤2.6:对步骤2.5两路相同全连接层输出结果合并,为F2全连接层;
步骤2.7:对步骤2.6输出计算Softmax、loss,并根据loss反向修正网络参数;重复步骤2.1-步骤2.7,直至loss收敛;
步骤3:将测试图片根据步骤1中的数据预处理方式进行叠加处理,构建3D立方体结构;利用步骤2得到的3D卷积神经网络测试分类结果。
2.如权利要求1所述的一种基于3D卷积神经网络的头部姿态估计方法,其特征在于所述步骤1将2D图片输入转化为3D立方体输入包括:首先数据集在采集使用平面内的头部转动角度,主要分为垂直角度和水平角度,垂直角度分为+90、+60、+30、+15、+0、-15、-30、-60、-90,水平角度分为+90、+60、+30、+15、+0、-15、-30、-60、-90,头部姿态主要9类,分别为中、上、下、左、右、左上、右上、左下、右下,每个人每一类有9张图像,数据输入时先将图片大小缩放为统一尺寸,然后将同一类的9张图片做叠加处理后输入3D网络。
3.如权利要求1所述的一种基于3D卷积神经网络的头部姿态估计方法,其特征是:步骤2.1中,C1层的卷积核尺寸为32@3*5*2。
4.如权利要求1所述的一种基于3D卷积神经网络的头部姿态估计方法,步骤2.2使用的两路不同卷积核,其特征是:C2层卷积核尺寸为64@5*7*1和64@3*8*1;C3层的卷积核尺寸为:128@5*6*2和128@7*5*2。
5.如权利要求1所述的一种基于3D卷积神经网络的头部姿态估计方法,其特征是:步骤2.3中,C4层的卷积核尺寸为256@6*10*3。
6.如权利要求1所述的一种基于3D卷积神经网络的头部姿态估计方法,其特征是:步骤2.4中,C5层的卷积核尺寸分别为512@5*11*2和512@11*11*2,C6层的卷积核尺寸分别为512@8*6*2和512@5*6*2。
7.如权利要求1所述的一种基于3D卷积神经网络的头部姿态估计方法,步骤2.5使用的两路相同全连接,其特征是:F1层全连接使用1*1*4096,F2层全连接使用1*1*2048。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州理工学院,未经贵州理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910530482.4/1.html,转载请声明来源钻瓜专利网。





