[发明专利]一种基于滑动窗口局部匹配窗口的动作识别方法有效
申请号: | 201410432364.7 | 申请日: | 2014-11-05 |
公开(公告)号: | CN104408461B | 公开(公告)日: | 2018-03-16 |
发明(设计)人: | 陈胜勇;王其超;沃波海;管秋;王鑫;汪晓妍;王万良 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/66;G06F17/30 |
代理公司: | 杭州斯可睿专利事务所有限公司33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 滑动 窗口 局部 匹配 动作 识别 方法 | ||
技术领域
本发明涉及视频识别领域,尤其是一种动作识别方法。
背景技术
人体运动特征描述是对序列图像中人体姿态信息的表达,它是人体动作识别的重要组成部分。人体运动是链式非刚体的运动,即身体各部分的运动是刚体运动,而从整体来看,人体的运动又呈现高度的非线性、非刚体性。
人体动作识别主要分为基于时空的动作识别方法和基于序列的动作识别方法。首先在训练视频集中为每一个动作构造对应的三维X-Y-T模型,然后通过匹配待识别动作序列与训练集各动作的三维X-Y-T模型,确定该测试动作的种类。基于时空的动作识别方法主要包括以下三类:基于时空卷的识别方法、基于运动轨迹的识别方法、基于时空局部特征的识别方法。
现有的识别方法存在的缺陷:无法识别相似的动作,识别率较低。
发明内容
为了克服动作识别方法的无法识别相似的动作,识别率较低的不足,本发明提供一种有效识别相似的动作、识别率较高的基于滑动窗口局部匹配窗口的动作识别方法。
本发明解决其技术问题所采用的技术方案是:
一种基于滑动窗口局部匹配窗口的动作识别方法,包括如下步骤:
1)从立体相机中获得场景中人的深度图序列,从深度图中提取出3D关节点的位置,用姿态之间的3D位移差作为每帧深度图的特征表达;
2)用聚类方法对训练集中的描述子进行学习,得到特征集合,并用它对每个描述子进行特征表达,从而得到每帧图像的编码表示;
3)采用基于滑动窗口的局部匹配模型,对整个动作图像序列进行动作片段划分,并得到每个动作片段的特征直方图表达;
基于滑动窗口的局部匹配模型的特征匹配过程如下:假设训练集中学习得到的特征码本个数为M,每个动作序列经处理后包含n帧深度图像。同时假定滑动窗口的尺寸为w,每次移动步长为l,则表示整个动作的特征向量的维度为
4)用一个长向量把所有片段的特征直方图表达串联起来,就是整个动作的特征表达。
进一步,所述步骤2)中,采用局部训练,首先用K-means聚类方法单独对每一类动作的训练集训练得到特征集合,然后将从所有动作集中学习得到的特征集合组成能够表征整个训练集的动作特征集合,最后将每类动作映射到训练得到的动作特征集合,得到每一类动作模型的特征直方图分布图。
再进一步,所述步骤2)中,对每一个姿态描述子进行量化编码。令P为从动作序列中获得的姿态特征描述子,每个特征描述子的维度为D,总共有N个特征,则令训练得到的码本有M个码字,即
编码方式如下:
其中,C=[c1,c2,...cm]表示对应特征码字集F的权值,*表示元素间相乘,di是局部适配因子,选取di为非线性的表达式,同时引入了最近相似距离distMin作为参考;
其中,dist(pi,F)=[dist(pi,f1),dist(pi,f2),…,dist(pi,fM)],dist(pi,fj)表示pi和fj之间的欧拉距离,σ为用于调节权重的系数;
distMin=min{dist(pi,f1),dist(pi,f2),…,dist(pi,fM)}。
更进一步,所述步骤4)中,假设训练集中的动作序列X分成了p个片段,对应的动作片段特征表达为H0(X),H1(X)…,Hp-1(X),则整个动作X的特征表达为:H(X)=[H0(X),H1(X)…,Hp-1(X)]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410432364.7/2.html,转载请声明来源钻瓜专利网。