[发明专利]基于深度图像的人体姿态估计方法有效
| 申请号: | 201210271289.1 | 申请日: | 2012-07-31 |
| 公开(公告)号: | CN102855470A | 公开(公告)日: | 2013-01-02 |
| 发明(设计)人: | 黄向生;徐波 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 图像 人体 姿态 估计 方法 | ||
技术领域
本发明属于图像处理、计算机图形学、人体运动学、最优化理论及计算机应用领域,具体涉及基于深度图像的人体姿态方法。
背景技术
人体姿态估计是人体运动捕捉的核心问题。所谓人体姿态估计是指将抽象层次特征与人体模型进行匹配,从而得到不同时刻目标所处的姿态。人体的姿态表达包括两个方面,一是整个人体在世界坐标的位置和方向;二是身体各部分关节的角度及受关节角影响的皮肤变形。人体运动姿态估计的主要应用领域可以分为三大方向:监控、控制、分析。
在监控应用方面,一些传统的应用包括在机场或地铁中自动检测并定位行人、人数统计或人群流动、拥塞分析等等。随着安全意识的提高,近年来出现了一些新型的应用——个人或人群的行为和动作的分析。比如在排队和购物中,检测不正常的行为或进行身份识别等。
在控制应用方面,人们利用运动估计结果或姿态参数来对目标进行控制。这在人机交互方面的应用最多。在娱乐产业如电影和游戏动画等,应用也越来越广。人们可以利用捕捉到的人的形状、外表和动作,来制作3D电影或重建游戏中的人的三维模型。
在分析应用方面,包括对外科病人的自动诊断、对运动员动作的分析和改进等。在视觉媒体方面,有基于内容的视频检索、视频压缩等应用。此外,在汽车产业方面也得到了相关的应用,比如安全气囊的自动控制、睡眠检测和行人检测等。
目前市场上比较成熟的人体运动捕捉系统有基于电动机械的,电磁的和特殊光学标志等类型。磁性或者光学的标记被附在人的肢体上,它们的三维轨迹被用来描述目标运动,这些系统是自动的,但是其设备非常笨重,且价格昂贵,无法得到广泛的应用。因此,基于计算机视觉人体运动捕捉技术已经成为研究热点。它利用计算机视觉的基本原理,从视频中直接提取三维人体运动序列.这种方法不需要在人体关节上附加任何传感器,保证了人体运动不受限制,而且造价低,效率高。当前流行的方法大多采用基于人体模型的匹配技术。这种方法的目标是在状态空间中找到一组姿态参数,使得对应这个参数的人体姿态与从观测图像中提取的底层特征最为符合。
在基于计算机视觉的运动跟踪这一领域,一般采用的研究方法是,在跟踪的开始确定图像序列中首帧的人体位置,后续序列中人体目标的确定依赖于人体运动的连续性和运动学约束条件。确定首帧人体位置有两种方法:一是人为规定目标的首个姿态或者将人体模型设定为首帧的近似姿态,这不利于人体跟踪的自动化。二是去除人体以外的背景后,使用部位检测方法确定身体的各个部位,这种方法可部分实现自动化,但需要人景分割的严格保证。在后续人体跟踪和三维姿态估计中,有基于模型和无模型的方法。基于模型的一般方法是事先建立人体的3D模型,将模型与运动序列的首帧匹配,在后续跟踪中,利用运动参数限制等条件,采用梯度下降或随机采样等优化方法进一步估计每一帧的模型参数,从而得出模型运动序列。这种方法的缺点是后续帧的跟踪存在累积误差,长时间跟踪容易出错。无模型方法不需要建立人体模型,而是根据人体运动呈现的几何、纹理、色彩等信息,采用学习或基于样本的方法来估计人体运动姿态。其缺点在于人体运动姿态难以用有限个状态描述,依赖于先验知识,且只能跟踪特定的动作集。这两种跟踪方法都可采用单目摄像机或多目摄像机实现。
由于不具有深度信息的普通图像在重建中存在从三维到二维映射的歧义性,且对于复杂运动姿态估计非常困难,因此在过去十多年的研究中,大多数人体运动跟踪技术的都是基于多摄像机条件下实现的,以此获得深度信息。然而,多摄像机的条件需要定标且不方便在普通家庭中布置,不利于运动捕捉技术的应用普及到千家万户中。近两年随着深度摄像机的出现,人们可以利用单个摄像机获得深度图像,基于单个深度摄像机的人体姿态估计技术成为了研究热点。
发明内容
(一)要解决的技术问题
本发明所要解决的技术问题是提出一种基于深度图像的人体姿态估计方法,以解决现有的人体姿态估计必需多个摄像机,设备复杂,难于实现的缺点。
(二)技术方案
为解决上述技术问题,本发明提出一种人体姿态估计方法,该方法根据人体的深度图像进行人体姿态的估计,以通过虚拟人体模型来模拟该图像中的人体,该深度图像包括多个帧,该方法包括如下步骤:
S1、建立虚拟人体模型,该人体模型由骨骼模型和皮肤模型组成;
S2、对所述虚拟人体模型的参数进行初始化;
S3、对所述深度图像的当前帧进行滤波;
S4、对所述虚拟人体模型和深度图像进行对应点检测;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210271289.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光谱纯度滤光片
- 下一篇:一种固态电化学发光检测三聚氰胺的方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





