[发明专利]一种人体姿态估计方法及系统有效
申请号: | 202110421844.3 | 申请日: | 2021-04-20 |
公开(公告)号: | CN113095251B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 王好谦;蔡元昊 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518088 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人体 姿态 估计 方法 系统 | ||
1.一种人体姿态估计方法,其特征在于,包括:
S1.对图像进行预处理,并对卷积神经网络进行预训练获得教师网络;
S2.将预处理后的图像分别输入至学生网络和所述教师网络,所述学生网络为骨干采用动态路径空间的卷积神经网络;
S3.所述教师网络的骨干部分输出多个不同尺度的第一特征图,再由业务层部分将所述第一特征图卷积生成第一热力图,同时所述第一特征图迁移至学生网络的动态路径空间的最后一个阶段的节点中;
S4.所述学生网络的骨干部分输出多个不同尺度的第二特征图,再由业务层部分将所述第二特征图卷积生成第二热力图,然后所述第一热力图的概率分布迁移至所述第二热力图中生成最终热力图;
S5. 将步骤S4生成的最终热力图进行解码获得人体骨骼关键的坐标;
其中,所述动态路径空间包括多个整齐排列的路径单元,每个路径单元包括一个操作节点和一个门函数;每个路径单元中,三个不同尺度的特征图输入至操作节点,并分别通过恒等连接、双三次上采样和降采样之后按位相加得到输入该路径单元的特征值,所述特征值输入到该路径单元之后分为三条支路,第一条支路为依次通过两个深度可分离卷积、一个批归一化和一个ReLU激活函数,第二条支路为恒等连接,第三条支路为先通过两层深度可分离卷积和全局均值池化将特征值的维度转化为B×3×1×1,再通过门函数。
2.如权利要求1所述的方法,其特征在于,所述步骤S1中对图像进行预处理包括:利用检测器将图像中的人体一一分别检测出来,并进行数据增强;选取残差网络ResNet152作为卷积神经网络的骨干来进行预训练获得教师网络。
3.如权利要求1所述的方法,其特征在于,所述第一特征图和所述第二特征图的不同尺度包括:预处理后图像为原图大小的1/4,1/8,1/16,1/32。
4.如权利要求1所述的方法,其特征在于,所述动态路径空间分为L个阶段,第i个阶段竖着排列个路径单元;且所述动态路径空间分为四层,从上往下输出图像的尺度依次为预处理后图像的1/4,1/8,1/16,1/32,第二、三层的路径单元有三个尺度的输出,第一、四层的单元只有两个尺度的输出,第L阶段的路径单元只有一个尺度的输出。
5.如权利要求1所述的方法,其特征在于,所述门函数表达如下:
其中v为任意实数,tanh为双正切函数,t为可以调整的超参数。
6.如权利要求1所述的方法,其特征在于,所述动态路径空间中包含计算复杂度的预算限定,且将所述计算复杂度的预算限定反映在损失函数上并进行优化。
7.如权利要求6所述的方法,其特征在于,所述动态路径空间的理论计算复杂度为:
其中,表示第
设置计算复杂度的监督目标为:
其中表示路径空间实际的计算复杂度,,表示衰减因子。
8.如权利要求7所述的方法,其特征在于,对多个不同尺度的第一特征图和第二特征图分别计算均方损失,对多个不同尺度的第一热力图和第二热力图的分别计算均方误差求和,为计算复杂度的监督目标,为最终热力图与真值标签之间计算的均方误差损失,总损失函数为:
其中,,,,为超参数,均可调整。
9.一种人体姿态估计系统,其特征在于,包括:
预处理模块:对图像进行预处理,并对卷积神经网络进行预训练获得教师网络;
教师网络:用于输入预处理后的图像,骨干部分输出多个不同尺度的第一特征图,再由业务层部分将所述第一特征图卷积生成第一热力图;
学生网络:包括采用动态路径空间的骨干网络,用于输入预处理后的图像,骨干部分输出多个不同尺度的第二特征图,再由业务层部分将所述第二特征图卷积生成第二热力图;
金字塔知识蒸馏模块:用于将所述教师网络的知识迁移至所述学生网络,包括金字塔特征蒸馏模块和金字塔热力图蒸馏模块;所述金字塔特征蒸馏模块用于对所述教师网络输出的多个不同尺度的第一特征图迁移至所述学生网络的动态路径空间的最后一个阶段的节点中;所述金字塔热力图蒸馏模块用于将所述教师网络输出的第一热力图的概率分布迁移至所述学生网络输出的第二热力图中;
骨骼关键点热力图解码模块:用于对所述第一热力图的概率分布迁移至所述第二热力图中生成的最终热力图进行解码获得人体骨骼关键的坐标;
其中,所述动态路径空间包括多个整齐排列的路径单元,每个路径单元包括一个操作节点和一个门函数;每个路径单元中,三个不同尺度的特征图输入至操作节点,并分别通过恒等连接、双三次上采样和降采样之后按位相加得到输入该路径单元的特征值,所述特征值输入到该路径单元之后分为三条支路,第一条支路为依次通过两个深度可分离卷积、一个批归一化和一个ReLU激活函数,第二条支路为恒等连接,第三条支路为先通过两层深度可分离卷积和全局均值池化将特征值的维度转化为B×3×1×1,再通过门函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110421844.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可自动规划路径的全方位移动机器人
- 下一篇:一种钢铁破碎装置