[发明专利]动作识别方法和装置有效
| 申请号: | 201310312228.X | 申请日: | 2013-07-23 |
| 公开(公告)号: | CN103345627A | 公开(公告)日: | 2013-10-09 |
| 发明(设计)人: | 刘云浩;苗欣;刘克彬;王思伦;杨磊 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
| 地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 动作 识别 方法 装置 | ||
技术领域
本发明涉及模式识别领域,具体涉及一种动作识别方法和装置。
背景技术
当前,人机交互的方式发生着重大的变革,从传统的按键式交互,到了今天从所周知的触屏交互,这种变化产生的原因主要是基于鼠标、键盘的传统人机交互设备的不便性日益凸显,如何使人与机器之间的交互能够自然的模拟人与人之间的交流变得越来越重要。人体动作识别技术无需借助任何计算机系统的传统的输入设备就能够识别用户意图,为用户提供了全新的操作体验。
在人体动作动作识别的研究中主要有两个方向:基于计算机视觉的人体动作识别和基于可穿戴的传感器的人体动作识别。基于计算机视觉的方法面临着一个难以克服的难题:遮挡,用户必须被严格地限定在与摄像设备之间没有遮挡的范围内。而可穿戴传感器却完全不受此限制,因此基于可穿戴的动作识别引起了学者们的研究兴趣,目前已经有很多基于手势交互的产品,比如Xbox的Kinect、任天堂的Wii等等。此外,由于智能手机的普及率越来越高,且当今的智能手机中已嵌入各种传感器,如加速传感器,陀螺仪等等,将人体动作识别技术运用到智能手机中,不但增强了智能手机的智能化程度,还丰富和便利了用户的生活。Taiwoo Park等在2011年举办的会议“The 9th ACM Conference on Embedded Networked SensorSystems”上发表的文章E-Gesture:A Collaborative Architecture for Energy-efficient Gesture Recognition with Hand-worn Sensor and Mobile Devices讲述了基于智能手机的手势动作的识别系统E-Gesture,其利用携带式传感器和智能手机相结合来进行手势动作识别,基本步骤如下:首先使用者携带传感器,开始手势动作;然后对收集的数据进行分割,一共进行两次分割,一次是基于加速传感器的分割,另一次是基于陀螺仪传感器的分割;分割后,进行部分噪声过滤,并将分割后的手势动作片段从传感器端发送到手机端;手机端进行手势动作识别。
然而,E-Gesture采用阈值分割法对手势动作进行分割,其对于噪声的过滤性不强,分割结果容易受到采集手势动作数据时引入的噪声的干扰,分割不精确导致降低了手势动作识别结果的正确率;E-Gesture使用隐马尔科夫模型进行建模,而隐马尔科夫模型需要大量的训练数据才能训练出很好的模型,在训练样本比较少的情况下达不到很好的效果;此外,E-Gesture利用外部传感器,结合手机完成手势动作识别,可扩展性不强。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题在于提供一种动作识别方法和装置,以克服在对动作分割时容易受到噪声干扰的问题。
(二)技术方案
作为本发明的一个方面,提供了一种动作识别方法,包括:
步骤S1:采集动作数据,针对所述动作数据计算拟合数据,所述拟合数据用于表征所述动作的能量变化的大小;步骤S2:将预定数量的所述拟合数据按时间顺序读入滑动窗口,所述滑动窗口随时间推移向前滑动以获得更新的拟合数据,根据滑动窗口内的拟合数据的中位数来确定动作启动点和动作停止点,提取所述动作启动点和所述动作停止点之间的所有所述动作数据作为有效动作数据;步骤S3:对所述有效动作数据进行识别,判断动作类型。
进一步地,所述步骤S1还包括:将所述拟合数据与预设的第一阈值进行比较,当所述拟合数据大于所述第一阈值时,判定所述动作处于开始状态,开始记录所述动作数据;当所述拟合数据小于所述第一阈值时,判定所述动作处于静止状态,如果静止时间大于预定时长,则停止记录所述动作数据。
进一步地,其中确定所述动作启动点包括:当滑动窗口内的拟合数据的中位数开始大于预设的第二阈值时,确定此时的中位数所对应的动作数据的采集时间为所述动作启动点;或者当滑动窗口内的拟合数据的中位数开始大于预设的第三阈值且开始大于或等于前一中位数的2倍时,确定此时的中位数所对应的动作数据的采集时间为所述动作启动点;其中所述第二阈值大于所述第三阈值。
进一步地,其中确定所述动作停止点包括:当滑动窗口内的拟合数据的中位数开始小于所述第三阈值时,确定此时的中位数所对应的动作数据的采集时间为所述动作停止点;或者当滑动窗口内的拟合数据的中位数开始小于所述第二阈值且开始小于或等于前一中位数的0.5倍时,确定此时的中位数所对应的动作数据的采集时间为动作停止点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310312228.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于球面全景视频的交通标志定位方法
- 下一篇:一种三维图像分析方法及系统





