[发明专利]二维视频图像中的人体姿态识别方法在审
申请号: | 201410734845.3 | 申请日: | 2014-12-05 |
公开(公告)号: | CN104392223A | 公开(公告)日: | 2015-03-04 |
发明(设计)人: | 王传旭;刘云;闫春娟;崔雪红;李辉 | 申请(专利权)人: | 青岛科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06K9/66 |
代理公司: | 青岛联智专利商标事务所有限公司 37101 | 代理人: | 李升娟 |
地址: | 266061 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二维 视频 图像 中的 人体 姿态 识别 方法 | ||
技术领域
本发明属于图像处理技术领域,具体地说,是涉及一种二维视频图像中的人体姿态识别方法。
背景技术
人体姿态识别可以应用于人体活动分析、人机交互以及视觉监视等领域,是近期计算机视觉领域中的一个热门问题。人体姿态识别是指从图像中检测人体各部分的位置并计算其方向和尺度信息,姿态识别的结果分二维和三维两种情况,而估计的方法分基于模型和无模型两种途径。
公开号为CN101350064A的中国专利申请,公开了一种二维人体姿态估计方法与装置。该方法首先检测出二维图像中的人体区域并确定人体部位在二维图像中的搜索范围。然后根据人体部位的搜索范围,结合人体部位的躯干、头部、手部、腿部、脚部,模板计算匹配相似度,实现各部位的识别;结合相邻部位之间的约束关系,得到二维人体的姿态。实施步骤如下:
第一步:利用现有的光流法、帧间差分法、背景相差分等已有方法检测二维图像中的人体区域。
第二步:确定人体区域中的多个人体部位的搜索范围。
(1)在人体区域中进行人脸检测,将检测到的人脸所在的位置作为头部的搜索范围;
(2)利用检测到的人脸肤色特征确定左、右手的搜索范围;进而确定人体躯干、左臂、右臂的搜索范围。
(3)将人体区域中的剩余部分确定为左腿、左脚、右腿、右脚的搜索范围。
第三步:根据各人体部位模板在相应的人体部位搜索范围内计算匹配相似度,确定人体各部位的最优位置,结合相邻人体部位之间的约束关系,得到二维人体的姿态。
上述估计人体姿态的方法存在着下述缺点:
其一,采用利用现有的光流法、帧间差分法、背景相差分等已有方法检测二维图像中的人体区域,存在光照变化、背景动态变化、光流多尺度计算速度慢等问题,往往会导致检测到的人体区域有较大误差,为后续的人体部位检测算法埋下隐患,会导致整体算法的失效;
其二,采用人脸检测方法进行头部区域定位会存在人脸部分或全部遮挡导致无法检测的问题,而且,人脸检测算法往往仅对正面人脸有很高的的检测精度,对侧面人脸效果较差;
其三,模板匹配的方法进行人体部位识别定位会产生精度不高的问题,表现在视频图像中的人体部位会因为尺度大小变化、衣着不同等因素,造成匹配识别算法的精度变差,导致人体部位定位错误,使整个算法失效。
发明内容
本发明的目的是提供一种识别精度高、识别速度快的二维视频图像中的人体姿态识别方法。
为实现上述发明目的,本发明采用下述技术方案予以实现:
一种二维视频图像中的人体姿态识别方法,所述方法包括下述步骤:
a、按照尺度空间分层原理将原始视频图像 分为组,,为所述原始视频图像的分辨率;
b、对每组视频图像,计算一个尺度为的采样图像,为中的其中一个尺度,表示采样函数,表示第组视频图像,,为所述原始视频图像的分辨率,为设定的大于1的自然数,表示每组视频图像包含的采样视频图像的数量, ;
c、对每组内的采样图像分别计算HOG底层特征描述符;
d、以步骤c获得的每组内的一个采样图像的HOG底层特征描述符为基础,根据预测公式计算每组内尺度为中其余()个尺度的采样视频图像对应的HOG底层特征描述符,和分别表示采样图像和采样图像的尺度,为设定值;
e、根据步骤c和步骤d的所有不同尺度采样视频图像的HOG底层特征描述符,结合训练好的SVM,检测所述原始视频图像中的人体目标区域;
f、采用训练好的随机森林分类器将步骤e检测的人体目标区域的像素进行分类,确定所述人体目标区域中的肢体部位区域;
g、将步骤f确定的各肢体部位连接形成人体轮廓,实现人体姿态识别。
优选的,所述步骤b中,利用中的端部尺度对每组视频图像采样,计算端部尺度对应的采样图像。
如上所述的二维视频图像中的人体姿态识别方法,所述步骤f中的随机森林分类器优选通过下述方法训练:
获取包括人体姿态的人工合成视频图像和目标测试场景中的真实视频图像,每幅视频图像作为一个训练样本;
依据设定肢体部位将每个训练样本中的背景区域及人体目标区域进行标注;
利用SURF算子计算每个标注区域的像素特征,所有标注区域及其像素特征数据构成训练数据集合;
利用所述训练数据集合及目标函数对随机森林分类器进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛科技大学,未经青岛科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410734845.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序