[发明专利]多人三维姿态估计方法、装置及电子设备在审
申请号: | 202111593360.3 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114550282A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 陈墨;王小娟;金磊;何明枢;徐晨阳;王璋 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/64;G06V10/40;G06V10/774;G06V10/764;G06K9/62;G06N3/04;G06N3/08;G06V10/82 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 朱智勇 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三维 姿态 估计 方法 装置 电子设备 | ||
本申请提供一种多人三维姿态估计方法、装置及电子设备,所述方法包括:获取相机拍摄的多人图像;基于骨干网络对所述多人图像进行特征提取,得到特征图;基于二维姿态回归模型对所述特征图进行回归计算,得到二维姿态结果;基于所述二维姿态结果和深度回归模型对所述特征图进行回归计算,得到深度回归结果;基于所述二维姿态结果和所述深度回归结果计算得到三维姿态估计结果。本申请将二维姿态回归与深度回归相关联,无需再对人体关键点进行分组,简化了多人三维姿态估计方法的过程。通过将二维姿态引导特征与根深度回归中的特征进行合并,提高了深度回归结果中的根绝对深度的估计结果的准确度,使得多人三维姿态估计的结果更加精确。
技术领域
本申请涉及姿态估计技术领域,尤其涉及一种多人三维姿态估计方法、装置及电子设备。
背景技术
人体姿态的表示方式一般是以骨架的形式表示,从单一图像估计单人的三维人体姿态估计任务取得了显著进展,一个更加现实和具有挑战性的任务引起了越来越多的关注,即:从单一图像估计多人的三维人体姿态。
目前,应用单阶段回归模型实现多人三维人体姿态估计在现实场景中存在以下一些问题:由于单一图像的深度信息不够明确,因此使用单一图像实现三维人体姿态估计会得到的估计结果并不准确。使用绝对深度来监督无法感知诸如人体尺度和背景位置等高级特征。
发明内容
有鉴于此,本申请的目的在于提出一种多人三维姿态估计方法、装置及电子设备用以解决或部分解决上述技术问题。
基于上述目的,本申请提供了一种多人三维姿态估计方法,包括:
获取相机拍摄的多人图像;
基于骨干网络对所述多人图像进行特征提取,得到特征图,其中,所述骨干网络为基于深度学习方法训练得到的模型;
基于二维姿态回归模型对所述特征图进行回归计算,得到二维姿态结果,其中,所述二维姿态回归模型为基于深度学习方法训练得到的模型;
基于所述二维姿态结果和深度回归模型对所述特征图进行回归计算,得到深度回归结果,其中,所述深度回归模型为基于深度学习方法训练得到的模型;
基于所述二维姿态结果和所述深度回归结果计算得到三维姿态估计结果。
进一步的,所述二维姿态结果包括:人体关键点、人体中心关键点坐标和人体关键点偏移映射集。
进一步的,所述基于二维姿态回归模型对所述特征图进行回归计算,包括:
基于所述特征图,根据以下公式分别对每个所述人体关键点对应的所述人体关键点偏移映射集中的每个人体关键点偏移映射进行计算:
O1=F1(X1),O2=F2(X2),...,On=Fn(Xn)
其中,Fm是第m个人体关键点对应的第m个回归器,Om是第m个人体关键点偏移映射,Xm是所述特征图分解得到的第m个人体关键点对应的第m个子特征图,1≤m≤n,n为所述人体关键点偏移映射集中偏移映射个数,其中,所述回归器为基于自适应卷积学习模型训练得到的模型。
进一步的,所述基于所述二维姿态结果和深度回归模型对所述特征图进行回归计算,得到深度回归结果,包括:
基于所述特征图通过所述深度回归模型输出根深度回归结果和相对深度回归结果;
基于所述特征图通过卷积计算得到二维姿态引导特征;
基于所述二维姿态引导特征和所述根深度回归结果计算得到根关键点深度回归结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111593360.3/2.html,转载请声明来源钻瓜专利网。