[发明专利]基于多模态自编码模型的单视角视频人体姿态恢复方法有效
| 申请号: | 201510305802.8 | 申请日: | 2015-06-04 |
| 公开(公告)号: | CN104899921B | 公开(公告)日: | 2017-12-22 |
| 发明(设计)人: | 俞俊;洪朝群 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06T17/00 | 分类号: | G06T17/00;G06T7/33 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙)33240 | 代理人: | 黄前泽 |
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于多层感知网络的单视角视频人体三维姿态恢复的方法。本发明包括以下步骤1、采用基于超图学习的多模态低秩矩阵表示获得图像的视觉特征;2、通过训练自编码模型获得图像与三维姿态的内在特征;3、采用无监督流形对齐技术,将图像与三维姿态的内在特征投影到一个共享的低维空间中;4、训练神经网络用于学习图像与三维姿态之间的映射关系;5、利用自编码模型,无监督流形对齐模型及神经网络模型,构建五层感知器网络,并微调五层网络的参数;6、以图像的多种视觉特征作为输入,得到的输出即为对应三维姿态。本发明不仅提高了三维姿态恢复的质量,而且缩短了姿态恢复的时间,可达到实时姿态恢复的要求。 | ||
| 搜索关键词: | 基于 多模态 编码 模型 视角 视频 人体 姿态 恢复 方法 | ||
【主权项】:
基于多层感知器模型的三维姿态重建方法,其特征在于包括以下步骤:步骤1、在提取视觉特征的过程中,针对图像的形状、颜色、边界多种视觉特征,采用基于超图学习的多模态低秩矩阵表示获得的图像的统一视觉特征;步骤2、在内在特征提取过程中,通过训练自编码模型分别获得图像与三维姿态的内在特征;步骤3、基于步骤2获得图像与三维姿态的内在特征,采用无监督流形对齐技术,将图像与三维姿态的内在特征投影到一个共享的低维空间中,获得低维特征;步骤4、在训练多层感知器网络的过程中,基于步骤3已获得的图像与三维姿态的低维特征,再训练一个神经网络模型用于学习图像与三维姿态之间的映射关系;步骤5、在训练多层感知器网络的过程中,利用步骤2中的自编码模型,步骤3中的无监督流形对齐模型以及步骤4中的神经网络模型,构建五层的全新感知器网络,以图像块作为输入,三维人体姿态作为输出,微调五层全新感知器网络的参数;步骤6、将步骤5得到的五层全新感知器网络做图像三维姿态重建,以图像的多种视觉特征作为输入,得到的输出即为对应三维姿态。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510305802.8/,转载请声明来源钻瓜专利网。





