[发明专利]基于多视点视频的复杂动态人体对象三维重建方法及系统在审
| 申请号: | 201711433635.0 | 申请日: | 2017-12-26 |
| 公开(公告)号: | CN107945269A | 公开(公告)日: | 2018-04-20 |
| 发明(设计)人: | 刘烨斌;王金宝;戴琼海;吕科 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06T17/00 | 分类号: | G06T17/00;G06T7/80;G06T7/10 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 张润 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 视点 视频 复杂 动态 人体 对象 三维重建 方法 系统 | ||
1.一种基于多视点视频的复杂动态人体对象三维重建方法,其特征在于,包括以下步骤:
对目标人体对象进行多视点拍摄,获得在同一时刻下的多视点二维图像;
利用深度网络学习后的深度神经网络模型分别对每个视点的二维图像序列中的人体各部分进行预测,分割出目标人体对象的轮廓信息和人体对象的骨架信息;
利用标定后的每个视点的相机内参和外参信息,结合分割后的所述目标人体对象的轮廓信息和所述人体对象的骨架信息,进行人体的三维建模。
2.根据权利要求1所述的基于多视点视频的复杂动态人体对象三维重建方法,其特征在于,所述对目标人体对象进行多视点拍摄,获得在同一时刻下的多视点二维图像,包括:
将多个视角的摄像头架设在人体对象周围,并对准在人体对象运动范围之内,保证摄像头一致,以获得在同一时刻下的多视点二维图像。
3.根据权利要求1所述的基于多视点视频的复杂动态人体对象三维重建方法,其特征在于,所述利用深度网络学习后的深度神经网络模型分别对每个视点的二维图像序列中的人体各部分进行预测,分割出目标人体对象的轮廓信息和人体对象的骨架信息,包括:
利用深度卷积神经网络DPM对人体的各部分关节点进行预测;
利用深度卷积神经网络LIP对人体的各身体部分进行预测,获得人物轮廓信息。
4.根据权利要求3所述的基于多视点视频的复杂动态人体对象三维重建方法,其特征在于,在所述利用深度卷积神经网络LIP对人体的各身体部分进行预测时,利用自己网络预测的关节点响应图同真实响应图计算损失loss,其中,
Lstructure=LJoint·LParsing,
其中,LStructure是结构损失,是整个网络的损失,是网络预测值,是真实标签值,LParsing是softmaxloss,LJoint是关节点预测值与真实值之间的损失。
5.根据权利要求1所述的基于多视点视频的复杂动态人体对象三维重建方法,其特征在于,所述利用标定后的每个视点的相机内参和外参信息,结合分割后的目标人体对象的轮廓信息和人体对象的骨架信息,进行人体的三维建模,包括:
对每个视角拍摄的相机进行标定,获得每个相机的内参和外参信息;
利用目标人体对象的轮廓信息,遍历空间模型中的每个点,确定是否属于人体对象;
如果空间的点投影到多个二维平面视图中都在人体对象轮廓内,则认为相应的点属于三维人体对象,直到遍历空间中的每个点,获得最终的人体的三维建模。
6.一种基于多视点视频的复杂动态人体对象三维重建系统,其特征在于,包括:
拍摄模块,用于对目标人体对象进行多视点拍摄,获得在同一时刻下的多视点二维图像;
信息获取模块,用于利用深度网络学习后的深度神经网络模型分别对每个视点的二维图像序列中的人体各部分进行预测,分割出目标人体对象的轮廓信息和人体对象的骨架信息;
三维重建模块,用于利用标定后的每个视点的相机内参和外参信息,结合分割后的所述目标人体对象的轮廓信息和所述人体对象的骨架信息,进行人体的三维建模。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711433635.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:传动齿轮
- 下一篇:一种三维数字沙盘系统





