[发明专利]一种基于神经网络的三维手部姿态估计方法有效
申请号: | 202110052293.8 | 申请日: | 2021-01-15 |
公开(公告)号: | CN112836594B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 李斌;刘宇馨;彭进业;范建平;张薇;乐明楠;李红颖 | 申请(专利权)人: | 西北大学 |
主分类号: | G06V20/64 | 分类号: | G06V20/64;G06V40/20;G06V10/46;G06V10/774;G06V10/82;G06N3/0464 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 李郑建 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 三维 姿态 估计 方法 | ||
1.一种基于神经网络的三维手部姿态估计方法,其特征在于,按下列步骤进行:
步骤一,数据预处理:首先将数据集中所需要的手部位置信息、二维关键点坐标、三维关键点坐标等信息用matlab处理成二值化信息,以便于后续减少后续网络计算量与训练时间、运算成本;
步骤二,为了更好的估计图像中的手的三维姿态,需要先获得手部在图像中的位置信息,用VGG16网络前十层提取图像特征;
所述手部在图像中的位置信息的获得方法是:
1)HandScore网络首先通过VGG-16网络的前十层提取图像特征其中的信息包括图像的颜色、纹理、形状和空间关系的特征;
2)将编码层提取到空间大小为W*H*512的信息进行上采样;通过一两通道步长为1的卷积层,得到图像手的热力图信息ScoremapW*H*2,其中通道一为背景信息得分图,通道二为手的位置信息;
步骤三,将提取的图像上采样至原图大小,网络用softmax+crossentropy的损失函数优化位置信息提取手部位置信息,即Scoremap;
步骤四,为了降低图像背景对后续姿态估计任务性能的影响,将原始图像信息与Scoremap信息融合,以一定程度模糊去除图像背景;
步骤五,将步骤四的结果输入实例分割网络中,以数据集中二维关键点为作为其真实值,得到其关键点的置信图;
步骤六,将置信图使用argmax处理后得到其二维关键点坐标,输入后续二维到三维映射网络中,用堆叠的方法映射出关键点在三维场景下的姿态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110052293.8/1.html,转载请声明来源钻瓜专利网。