[发明专利]基于Fréchet距离的动态手势识别方法有效
| 申请号: | 201310752309.1 | 申请日: | 2013-12-31 |
| 公开(公告)号: | CN103745228B | 公开(公告)日: | 2017-01-11 |
| 发明(设计)人: | 张长水;侯广东;崔润鹏 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
| 代理公司: | 北京中伟智信专利商标代理事务所11325 | 代理人: | 张岱 |
| 地址: | 100084*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 fr chet 距离 动态 手势 识别 方法 | ||
技术领域
本发明涉及一种基于Fréchet距离的动态手势识别方法。
背景技术
手势是人们日常用以表达内心活动、同他人进行沟通交流的重要方法。我们通常根据手势在时间维度上的变化情况,将手势分为静态手势和动态手势。
静态手势是指在某一时刻相对固定的手指、手掌的位置、朝向、姿态等特征构成的手的特定空间状态。特定的静态手势可以用特征空间中与之对应的特定点来表示。与之相对应的则是动态手势,它由一段时间区域内连续变化的手的运动、姿态序列所构成。对于动态手势而言,如果我们选取合适的特征对特定时间点的手势信息进行描述,那么随着时间t,t=1,2,...,T的连续变化,我们就得到了该动态手势对应的一段特征序列(F1,F2,...,FT)。如果我们将特征序列中的各元素在特征空间中依次作出,那么动态手势总可以用特征空间中一条对应的曲线来描述。
而动态手势描述出来以后,下面的问题便是手势识别。一般而言,手势识别的基本任务就是将手势所对应的特征与现有模型相匹配,从而将手势所对应的特征参数空间中的曲线或点划分为不同集合或类别的过程。
目前,手势识别系统的流程框架一般由手势建模、手势分析和手势匹配等三部分构成。
手势建模通常是针对给定的手势。通常情况下,手势模型的选取需要结合实际应用背景来确定。如对于动态手势而言,手势模型的选取需要反映其在时间、空间维度上的特征,同时要将手势的运动视为前后紧密联系的过程。
一旦手势模型确定下来,我们将通过手势分析过程计算手势的相关特征参数,这些特征实际上代表了对于特定手势姿态和运动轨迹某种描述。手势分析的过程较为复杂,它通常是手势定位、特征选择、特征提取、模型参数估计等过程的综合。通过这一系列过程,我们从图像或视频中将与手势相关的部分分离出来,并根据对手势的定位,从相关区域或根据视频中前后帧的关系,提取特征数据用以对手势的观测状态进行适当的描述,同时根据训练样本特征对模型参数进行估计。上述各步骤的实现方法同样需要根据问题的具体应用背景来进行设计。
手势匹配的基本任务则是将特征与模型相匹配,从而将手势所对应的特征参数空间中的曲线或点划分为不同子集的过程。目前常用思路是将提取的特征同预先得到的模型进行某种形式的相似性度量,依据相似程度确定待识别手势对应的分类。
发明内容
针对上述问题,本发明的目的在于提供一种基于Fréchet距离的动态手势识别方法。
为达到上述目的,本发明所述一种基于Fréchet距离的动态手势识别方法,至少包括以下步骤:
获取输入视频中待识别的动态手势片段的手势位置信息;
获取所述手势位置处连续前后帧的手势状态变化特征序列;
将获取的手势状态变化特征序列与预设模型中的特征序列依据Fréchet距离进行匹配;
根据Fréchet距离匹配信息获取相似性结果并输出。
优选地,所述获取输入视频中待识别的动态手势片段的手势位置信息的具体步骤为:
根据视频中像素的RGB值,获取视频任意一帧图像中肤色区域出现的概率值;
根据所述概率值判断得到视频各帧图像中分布的所有肤色区域;
获取各个肤色区域在连续前后帧图像的光流值;
根据分布的所有肤色区域的光流值,得到平均光流值最大的区域,即手势位置区域。
优选地,所述获取所述手势位置处连续前后帧的手势状态变化特征序列包括运动轨迹变化特征序列和姿态变化特征序列。
优选地,所述运动轨迹变化特征序列的匹配步骤为:
设置手势位置区域内视频图像的任意一帧与前一帧的平均光流为方向矢量,即:F=(x,y),其中x,y分别表示平均光流在横向、纵向上的分量;
获取输入视频图像各帧所对应的运动特征序列为(F1,F2,...,FT);
获取模型中设置的运动特征序列为(M1,M2,...,MT);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310752309.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于空间信息迁移的高光谱图像分类方法
- 下一篇:一种多元化农用膜打孔装置





