[发明专利]一种基于深度信息的手势识别方法有效
申请号: | 201210242290.1 | 申请日: | 2012-07-13 |
公开(公告)号: | CN102789568A | 公开(公告)日: | 2012-11-21 |
发明(设计)人: | 尚凌辉;张兆生;贺磊盈;余天明;高勇 | 申请(专利权)人: | 浙江捷尚视觉科技有限公司 |
主分类号: | G06K7/00 | 分类号: | G06K7/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310013 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 信息 手势 识别 方法 | ||
技术领域
本发明属于人机交互技术领域,涉及一种基于深度信息的手势识别方法。
背景技术
近年来手势识别技术取得了快速的发展。基于单摄像机的手势识别、基于双摄像机的手势识、微软的kinect手势识别已相继出现在家电控制、游戏控制等应用领域,然而在实际应用环境和用户体验上均存在着一定的问题,主要表现在:
单摄像机下存在的多人体或手势出现遮挡时,手部无法准确定位,导致识别率较低;如专利《基于视觉的静态手势识别方法》、《互动系统中的动态手势识别方法》等;
单摄像机与双摄像机下的方法主要以人体的肤色、大小和运动等信息作为主要特征,使用时操作距离、手部颜色等受到限制;如专利《一种头戴式立体视觉手势识别装置》;
微软的kinect不能适应光照的变化,户外的阳光照射和室内的开关灯均会存在干扰,仅应用于光源稳定的室内场景。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于深度信息的非接触式手势识别方法,使识别率不受距离、肤色、遮挡、光照、运动等因素的影响,能够适应复杂多变的应用环境。
本发明解决技术问题所采取的技术方案:
步骤1:从可输出深度信息的双目摄像机中获取实时的深度图像,对深度图像使用混合高斯的背景建模方法获得背景图像。
步骤2:利用背景图像和当前图像作差分,检测出前景区域。
步骤3:利用双背景更新方法对建立的背景图像进行更新。
步骤4:通过统计方法学习人体形态的模型,并根据人体模型对检测出的区域进行分割,以提取出独立的人体区域。
步骤5:通过统计方法学习手部模型的分类器,在每个独立的人体区域上检测出手部区域、轮廓信息;若能够检测出手部区域,则执行步骤6,若检测不到手部区域,则跳转至步骤1。
步骤6:通过手部的运动状态利用自回归模型对手部运动进行预测,基于预测位置,以手部区域的深度信息为特征,利用面积加权均值偏移方法跟踪手部,获取手部跟踪的运动轨迹。
步骤7:利用隐马尔科夫模型对运动轨迹进行建模,从而识别出手势。所述的手势包括水平方向的单手运动、水平方向的双手运动、垂直方向的双手运动和单个阿拉伯数字单手绘制运动。
本发明的有益效果:本发明能够适应肤色变化的干扰,在室内环境下不受距离、光照、遮挡、运动等因素的影响,算法计算量小,实时性高。
附图说明
图1为本发明方法流程图。
具体实施方式
以下结合附图对本发明作进一步说明。
步骤1:从可输出深度信息的双目摄像机中获取实时的深度图像,对深度图像使用混合高斯的背景建模方法获得背景图像。由于深度计算方法易受遮挡、扭曲等影响而使深度图像中出现噪点、空洞等情况,因此这里的混合高斯方法利用三个高斯核。即图1的建立背景模型步骤。
步骤2:利用背景图像和当前图像作差分,检测出前景区域。即对应图1的运动检测。
步骤3:利用双背景更新方法对建立的背景图像进行更新,以降低对深度图像计算误差的影响。
步骤4:收集人体样本和非人体样本,采用随机森林分类器训练出人体形态的模型。在实时处理时,首先对前景区域进行垂直投影,得到投影直方图;统计投影直方图,估计出人体的数目和位置;然后利用该位置和数目作为初始,基于人体形态的模型、占用前景的概率和未占用前景的概率作为约束,利用马尔科夫链蒙特卡洛方法搜索出最优的人体数目和位置,以分割出独立的人体区域。即对应图1的人体分割。
步骤5:若没有人体区域,则直接跳出本次处理,否则基于检测出的人体区域进行手部定位,传统方法大多基于肤色、运动等信息受限制较大。假设待定位的手部自然伸展且位于身体之前,因此在深度图像上手部的视差大于身体且在已知的范围内,通过收集人体样本,并获取对应的深度图,采用随机森林分类器学习出人体与手部视差的分布概率以用于从深度图上分割出手部区域。另根据手臂与手的连贯性和人体的对称性可定位出左右手的位置,且有效滤除其它接近的运动物体或其它人体的手部。若无法检测出手部区域且未进行手势跟踪,则跳出本次处理,否则执行手势跟踪模块。
步骤6:提取手部区域的轮廓、区域等信息,若没有处于手势跟踪状态,或手部检测的置信度较高,则更新跟踪的特征模型,否则不做更新。首先对手势的运动方程参数进行估计,设手势的运动轨迹有如下三次恒加速多项式的自回归模型描述:
,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江捷尚视觉科技有限公司,未经浙江捷尚视觉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210242290.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:现代过滤槽耕刀升降高度检测机构
- 下一篇:快速捆绑带
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置