[发明专利]基于多模态自编码模型的单视角视频人体姿态恢复方法有效

申请号：	201510305802.8	申请日：	2015-06-04
公开（公告）号：	CN104899921B	公开（公告）日：	2017-12-22
发明（设计）人：	俞俊;洪朝群	申请（专利权）人：	杭州电子科技大学
主分类号：	G06T17/00	分类号：	G06T17/00;G06T7/33
代理公司：	杭州君度专利代理事务所(特殊普通合伙)33240	代理人：	黄前泽
地址：	310018 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于多层感知网络的单视角视频人体三维姿态恢复的方法。本发明包括以下步骤1、采用基于超图学习的多模态低秩矩阵表示获得图像的视觉特征；2、通过训练自编码模型获得图像与三维姿态的内在特征；3、采用无监督流形对齐技术，将图像与三维姿态的内在特征投影到一个共享的低维空间中；4、训练神经网络用于学习图像与三维姿态之间的映射关系；5、利用自编码模型，无监督流形对齐模型及神经网络模型，构建五层感知器网络，并微调五层网络的参数；6、以图像的多种视觉特征作为输入，得到的输出即为对应三维姿态。本发明不仅提高了三维姿态恢复的质量，而且缩短了姿态恢复的时间，可达到实时姿态恢复的要求。
搜索关键词：	基于多模态编码模型视角视频人体姿态恢复方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

基于多层感知器模型的三维姿态重建方法，其特征在于包括以下步骤：步骤1、在提取视觉特征的过程中，针对图像的形状、颜色、边界多种视觉特征，采用基于超图学习的多模态低秩矩阵表示获得的图像的统一视觉特征；步骤2、在内在特征提取过程中，通过训练自编码模型分别获得图像与三维姿态的内在特征；步骤3、基于步骤2获得图像与三维姿态的内在特征，采用无监督流形对齐技术，将图像与三维姿态的内在特征投影到一个共享的低维空间中，获得低维特征；步骤4、在训练多层感知器网络的过程中，基于步骤3已获得的图像与三维姿态的低维特征，再训练一个神经网络模型用于学习图像与三维姿态之间的映射关系；步骤5、在训练多层感知器网络的过程中，利用步骤2中的自编码模型，步骤3中的无监督流形对齐模型以及步骤4中的神经网络模型，构建五层的全新感知器网络，以图像块作为输入，三维人体姿态作为输出，微调五层全新感知器网络的参数；步骤6、将步骤5得到的五层全新感知器网络做图像三维姿态重建，以图像的多种视觉特征作为输入，得到的输出即为对应三维姿态。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学，未经杭州电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510305802.8/，转载请声明来源钻瓜专利网。

上一篇：一种基于褶皱基线的三维褶皱生成方法
下一篇：一种基于历史数据挖掘的高分遥感影像土地覆盖变化检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T17-00 用于计算机制图的3D建模
G06T17-05 .地理模型
G06T17-10 .体积绘图，例如：圆柱体、六面体或使用结构实体几何
G06T17-20 .线框绘图，例如：多边法或镶嵌
G06T17-30 .表面绘图，例如：多项式表面绘图

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于多模态自编码模型的单视角视频人体姿态恢复方法有效

专利文献下载