[发明专利]一种面向立体电视的手势操控方法在审
| 申请号: | 201410217498.7 | 申请日: | 2014-05-21 |
| 公开(公告)号: | CN104038799A | 公开(公告)日: | 2014-09-10 |
| 发明(设计)人: | 王元庆;徐柳婧 | 申请(专利权)人: | 南京大学 |
| 主分类号: | H04N21/422 | 分类号: | H04N21/422;G06F3/01 |
| 代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
| 地址: | 210093 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 立体电视 手势 操控 方法 | ||
技术领域
本发明涉及手势识别的方法,尤其是应用于立体电视操控的手势识别的方法。
背景技术
人机交互是研究人与计算机之间交互的研究领域,大部分时候,识别某个手势对于人类来说是毫不费力的,但是对于机器来说,这是一个及其复杂的过程,这个过程涉及信号处理、机器视觉、统计分析、行为学、心理学、机器学习以及认知科学等多个领域。
近年来,基于智能技术的人机交互技术得到巨大的发展,传统的显示器遥控器、键盘、鼠标、触摸屏等已经越来越不能新的需求,迫切的需要对空间约束性小、更为舒适、自然易懂的新型交互技术,用户识别、触摸屏、语音输入、手势控制、体感控制和眼球鼠标等新一代智能交互技术都已经用于成熟产品,特别是利用语音、手势、表情进行人机交互的方式得到越来越认同和研究。对手势识别而言,早期人们采用专用的收据手套或者触摸屏等辅助设备,但是这些设备不可避免都要与身体接触,并且存在空间等限制,于是基于视觉的手势识别出现并迅速发展。
基于视觉的手部坐标的获得的方法有很多种,其中基于运动信息的手部坐标的获得,主要通过相邻图像差分来检测手势;而基于运动模板的方法,依靠模板匹配与待检测图片的匹配来完成手部图像的提取;基于颜色信息的手部坐标的获取,主要是依赖对手部肤色的检测判别来分割出手部的图像;而基于特定硬件的方法,以Kinect为例,Kinect是微软开发的一种3D体感摄影机,通过彩色摄像头、红外线发射器、红外线CMOS摄像头构成的3D结构光深度感应器,来获得人体关节点的位置并连接关节点获得人体的骨架,包括获得人手部,头部的位置,由此进行应用的开发。
现有技术涉及手势识别方法已经公开较多,其中典型的有基于人工神经网络ANN的方法、基于概率统计模型(HMM)的方法、基于支持向量机SVM的方法、基于动态时间规划DTW的方法。
基于人工神经网络ANN是一种基于决策理论方法的识别方法,能进行大规模分布式并行信息处理,是一种模仿生物神经网络的结构和功能的数学模型。结合机器学习,这种数学模型能够在外界信息的基础上改变内部结构,是一种自适应的、非线性的数据拟合工具。一个人工神经网络由若干计算节点构成,每个节点代表一定的“激励函数”,从而每个节点可以拟合出一个超平面将多维空间分成两部分。同时,两个节点之间的连接被赋予权重值以衡量相互连接的两个节点之间的刺激程度。
基于概率统计模型(HMM)中,每一个状态的转移只依赖于其之前的那一个状态。HMM是一个双重的随机过程,一方面,隐马尔科夫模型具有一条由隐含状态构成的马尔科夫链;另一方面隐马尔科夫模型还具有一个由隐含状态概率决定的观察向量,所以HMM是一个含有隐含未知参数的马尔可夫过程。它能很好的解决不同手势间时间上的非线性波动问题,提供了时间尺度不变形。
基于支持向量机SVM是通过把特征向量映射到高维空间,使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题,并通过一个线性超平面实现多维空间的分类,在构造分类超平面时不是基于训练样本空间最小化经验风险,也不是基于泛化性最小化置信区间,而是最小化两者的和——期望风险。因此,经过SVM机器学习得到的分类超平面可以有效的避免陷入局部最优解而得到全局最优解,从而在保证具有优秀的分类性能的同时具有良好的泛化性。
基于动态时间规划DTW的方法,基于动态优化的思想,目标是使模板和测试序列达到最大程度的重叠,测试序列上的采样点被映射到参考序列上,通过弯曲其中一个模式的时间轴,消除模式之间的时间差别。
发明内容
本发明的目的是:提出一种面向立体电视的手势操控系统,该方法利用基于运动信息、基于运动模板、基于颜色或深度信息或基于特定检测硬件的方法获取手部的坐标,通过手势的识别,快速而有效地理解操作者的意图,实现实时的手势的识别与理解。其中,方法中用到了分段检测、编码识别、模板匹配和滤波运算有效地保证了最后识别的精确性和实时性。
本发明的技术解决方案如下:面向立体电视的手势操控方法,利用基于运动信息、基于运动模板、基于颜色或深度信息或基于特定检测硬件的方法获取手部的坐标,检测手部在操控距离的范围内,则开始进行手势的识别;通过模板匹配或滤波算法校正手部坐标的误差;然后采用后续的手势识别算法完成手势含义的识别,手势识别采用基于人工神经网络ANN、基于概率统计模型(HMM)、基于支持向量机SVM或基于动态时间规划DTW的方法;将识别的结果交由控制算法进行立体电视的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410217498.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多通道流体控制阀
- 下一篇:一种用于中水回收的装置





