[发明专利]一种基于三维深度图像信息的并行统计学习人体部位检测方法有效
申请号: | 201110435745.7 | 申请日: | 2011-12-22 |
公开(公告)号: | CN102609680A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 黄向生;徐波 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周国城 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三维 深度 图像 信息 并行 统计 学习 人体 部位 检测 方法 | ||
技术领域
本发明涉及图像处理、模式识别、人机交互及视觉监控等领域,尤其是一种基于三维深度图像信息的并行统计学习人体部位检测方法。
背景技术
随着计算机性能的逐步提高和各个领域对计算机使用的不断深入,人与计算机的交互技术日益成为计算机领域的研究热点。基于动态序列图像的目标识别已经成为近年来计算机视觉领域中备受关注的研究内容,它主要从图像序列中检测、识别、跟踪以及对生物特征理解和描述进行研究。
目标检测是目标识别中最为关键的一步,是研究如何让计算机以人的思维方式从图像或视频中找出目标对象所在区域的技术。其中人手检测技术是研究难度最大的一个问题。目前,赤手交互成为虚拟游戏中非常吸引人的一项应用,这将引起新一轮的对人体部位检测实时性研究的热潮。
在过去的20年中,大量的目标检测方法被提出。例如,基于神经网络的检测方法、基于支持向量机的检测算法、基于隐形马尔可夫模型的检测方法和基于概率的检测方法。然而,大多数的算法都只是应用图像的原始像素作为特征,他们大多对光照变化和噪声十分敏感。目前最主流的目标检测方法是基于AdaBoost学习的统计模型方法。
人体部位检测涉及图像处理、模式识别、人机交互及视觉监控等领域,在虚拟现实、人机交互、视觉监控等领域均有着广阔的应用。人体部位检测不仅需要完成目标特征的构造和进行相应的脱机训练,实现实时的动态监测,同时还要排除背景噪声和不特定的干扰等问题,这也是需要面临和克服的挑战性问题。
发明内容
由于人体部位(头、手、脚)具有多样性、方向性、多义性等因素,仅仅应用现有的简单特征训练并不能得到理想的检测效果。为了解决人体部位(头、手、脚)检测中特征多样性的问题,以及获得实时的检测效果,本发明提供了一种新型的特征——万向特征(Omni-direction Features),结合并行级联的统计学习算法进行人体部位检测,保证实时检测的情况下实现了高检测率。从而在目标检测和模式识别等方面具有重要的作用。
本发明所处理的数据源是三维深度图像,这与常见的灰度图像和彩色图像有很大的不同。三维深度图像是将摄像头与拍摄目标的各个像素点的距离读取并储存而获得的图像数据,用不同的灰度来体现图像中像素点的距离信息。
本发明所提出的一种基于三维深度图像的人体部位检测方法,其特征在于,该方法包括以下步骤:
步骤1,采用深度摄像头采集多幅三维深度图像并对其进行处理,建立人体部位样本数据库;
步骤2,对于人体部位样本数据库中的每幅图像,构造描述各人体部位的万向特征;
步骤3,对于所述万向特征基于并行级联的统计学习算法训练分类器,得到贡献力最大的那些万向特征;
步骤4,基于步骤3得到的贡献力最大的万向特征,对从深度摄像头实时读入的图像进行人体部位的检测,并对检测出的人体部位区域进行标注显示。
本发明的有益效果是:
a.目标实时检测,保证了实时的检测速度,检测效果优越;
b.相比较其他特征如haar-like特征,运用万向特征(Omni-direction Features)大大提高了检测率;
c.运用并行级联的分类器进行训练,由于是分层训练的关系,每次分组到特征集的特征数目远小于未分组时的特征数目,在训练时间方面有很大的提高,训练速度是原来速度的N-1倍(N为特征的分组数);
d.因为设定分类器的训练在达到600个特征的时候就会停止(分类器必须设定一个停止的参数,无限制的训练下去,到后期的训练已经没有意义),原来未分组的分类器在特征的选择上会受到分类器特征数目的限制,选择到的特征不够精细和丰富。分组训练所能挑选的特征虽然也受到这一因素影响,但因为是分成了N组的原因,每组分配到的特征基本都可以完全参与训练选择,大大提高了可选择的特征数目;
e.在检测率上有很大提高。因为选择到的特征的贡献比未分组的特征贡献性总体要好,所以在误判率上有很好的改善,误检率降低了近3倍。
本发明运用前景广泛,在目标检测,模式识别,计算机图像处理等方面有着重要作用,也为计算机三维应用在实时检测跟踪方面提供了应用趋势。
附图说明
图1是本发明所提出的基于三维深度图像信息的并行统计学习人体部位检测方法流程图。
图2是本发明人体部位样本数据库的例图。
图3是本发明的万向特征(Omni-direction Features)的矩形块表示图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110435745.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序