[发明专利]获取空间定位的三维人体姿态估计方法及计算机可读存储介质在审
申请号: | 202110121062.8 | 申请日: | 2021-01-28 |
公开(公告)号: | CN112837362A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 王好谦;高艺华;杨芳 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06T7/70 | 分类号: | G06T7/70;G06N3/08 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 孟学英 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 空间 定位 三维 人体 姿态 估计 方法 计算机 可读 存储 介质 | ||
本发明提供一种获取空间定位的三维人体姿态估计方法及计算机可读存储介质,方法包括:采用人体检测网络从原始图像中获取单人图像并做标准化处理;使用二维人体姿态估计的方法从所述单人图像中预测关键点的二维坐标,使用三维姿态生成器从所述关键点的二维坐标预测所述关键点的三维坐标,得到三维人体姿态估计的结果;同时从二维人体姿态估计网络的特征中获取人体参数;根据所述人体参数校正所述三维人体姿态估计的结果的尺度;计算视角偏差,旋转校正后的三维人体姿态估计结果与相机坐标系对齐;依据透视投影的原理,拟合绝对深度,获取空间定位,完成三维人体姿态估计。提高结果准确性、降低系统误差。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种获取空间定位的三维人体姿态估计方法及计算机可读存储介质。
背景技术
对包含人像的二维RGB图像进行人体姿态估计,即根据图片信息输出指定人体关键点的坐标位置,是计算机视觉领域一个非常有价值的研究方向。人体姿态估计的检测结果可进一步服务于人体重建、人机交互、行为识别、虚拟现实、游戏建模等多个工业领域,已经应用于许多产品。相比于二维姿态,三维姿态估计的结果在应用中能提供更高维、更丰富的信息,具有广阔的应用前景。因此,近年来三维姿态估计得到国内外研究者的关注。
当一张图片中有多个人体,采用的三维人体姿态估计方法分为自顶向下和自底向上两种,前者首先检测单个人体,再通过设定的方法获取三维关键点坐标,准确性较高;后者首先检测多人的所有关键点,再结合全局信息通过匹配方法将属于同一个人的关键点相连接,实时性较好。获取三维关键点坐标的方法有多种,主要有:从关键点二维坐标生成三维坐标;从图像中直接预测关键点三维坐标;从图像中同步估计关键点的二维坐标与三维坐标估并共享信息,等。
从关键点二维坐标生成三维坐标的方法,指的是首先从原始图像中运用二维人体姿态估计方法获取关键点的二维坐标,使用三维姿态生成器仅通过学习二维坐标点信息推断出对应的第三维坐标。此方法的好处有:二维人体姿态估计方法较为成熟可靠,可为后续任务提供先验信息,较图片而言是更高维、更集中的特征;另外,二维到三维坐标的生成过程中,用来进行监督训练的数据为二维-三维坐标对,数据总量很小,相比于其他使用原始图像作为输入的方法占显存小,训练速度快。缺点是仅从二维坐标获取到的信息有限,缺失图片丰富的信息表达。
在自顶向下的三维人体姿态估计任务中,评价指标的设定使得预测结果通常只能表示以自身为根节点的坐标系中各关键点的坐标位置,而无法显示与图片中其他人的相对位置关系。解决这个问题需要预测每个人体关键点在相机坐标系中的绝对位置,实现人体的空间定位,从而满足多人三维姿态估计中对多人关系的理解和直观视觉需求。
现有的自顶向下的三维人体姿态估计方法,通常直接将神经网络输出的关键点三维坐标作为最终结果,不再进行其他处理。默认此结果与真实人体大小相同、方向一致,是一个存在偏差的假设。将预测结果与真实标签做比较之前,还需要将上述误差尽可能降低,而这一点目前还未得到有效的解决。
以上背景技术内容的公开仅用于辅助理解本发明的构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
本发明为了解决现有的问题,提供一种获取空间定位的三维人体姿态估计方法及计算机可读存储介质。
为了解决上述问题,本发明采用的技术方案如下所述:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110121062.8/2.html,转载请声明来源钻瓜专利网。