[发明专利]一种多维加权的3D动态手势识别方法有效
申请号: | 201410366945.5 | 申请日: | 2014-07-29 |
公开(公告)号: | CN104123007B | 公开(公告)日: | 2017-01-11 |
发明(设计)人: | 康波;李云霞;孙琴;蔡会祥 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F3/01 | 分类号: | G06F3/01 |
代理公司: | 成都行之专利代理事务所(普通合伙)51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多维加权的3D动态手势识别方法,在训练阶段,首先对标准手势进行分割,获得标准手势的特征向量,然后进行坐标系转换、归一化处理、平滑处理、降采样以及差分处理,得到一个标准手势的特征向量集以及其中各关节点的权值和元素各维的权值,这样构建出标准手势样本库。在识别阶段,采用多维加权动态时间规整算法计算待识别手势的特征向量集分别与标准手势样本库中的各个标准手势的特征向量集c=1,2,…,C的动态规整距离,在计算代价矩阵C第(m,n)个元素s(m,n)时,考虑关节点的权值以及元素中各维的权值,去掉了对手势识别无贡献的关节点和坐标维数,有效去掉了关节抖动、人体误动作对手势识别造成的干扰,提高了算法的抗干扰能力,最终提高的手势识别的正确率和实时性。 | ||
搜索关键词: | 一种 多维 加权 动态 手势 识别 方法 | ||
【主权项】:
一种多维加权的3D动态手势识别方法,其特征在于,包括以下步骤:(1)、训练阶段1.1)、手势分割从图像输入设备提供的连续人体动作视频中获取标准手势的关节点数据,并跟踪左右手、左右手腕、左右手肘这6个关节点的位置,当检测到手处于伸出状态即手的Z坐标值在跟踪的六个关节点的Z坐标值中最小时,并且手的移动速度在接下来的连续的若干帧图像中由0增加到某一阈值,认为手势开始;当该手部的移动速度在连续的若干帧图像中逐渐减小到某一阈值,则认为手势结束;1.2)、获取手势特征向量手势分割结束后,根据跟踪的6个关节点的连续坐标信息,得到描述该标准手势的运动轨迹;对于每一帧图像,6个关节点的位置信息:ftc={(x1t,y1t,z1t),(x2t,y2t,z2t),(x3t,y3t,z3t),(x4t,y4t,z4t),(x5t,y5t,z5t),(x6t,y6t,z6t)}]]>其中,t为图像帧序号,为第t帧图像中第i个关节点的三维坐标,这些关节点分别为右手、右手腕、右手肘、左手腕、左手肘、左手;看成是一个包含6个元素的特征向量,而其中的每个元素是三维的,c表示这个特征向量所属的标准手势类别;一个标准手势就是上述特征向量的集合,一个标准手势需要N帧的时间完成,则它对应的特征向量集为:N为标准手势持续的帧数;1.3)、坐标系转换以肩部中心这一关节点为基准,把每一帧获取的关节点的坐标系转换为以肩部中心为原点的用户坐标系:肩部中心的坐标为(Cx,Cy,Cz),第t帧图像中关节点i的坐标为i∈[1,6]转换完之后的坐标为则xi′t=xit-Cx,,]]>yi′t=yit-Cy,]]>zi′t=zit-Cz;]]>经过处理之后,关节点所参考的坐标系就变成了以肩部中心这个关节点为原点的用户坐标系;这样对应的特征向量具有平移不变性,不受手离图像输入设备的距离以及手势起始位置的影响;1.4)、归一化处理记特征向量集合Fc中,x,y,z三个坐标分量的最大值、最小值分别为XMax,XMin,YMax,YMin,ZMax,ZMin,对每一维坐标采用线性函数进行如下处理:x^it=(xi′t-XMin)/(XMax-XMin),]]>y^it=(yi′t-YMin)/(YMax-YMin),]]>z^it=(zi′t-ZMin)/(ZMax-ZMin),]]>则:第c类标准手势经过预处理之后的特征向量集为:F^c={f^1c,f^2c,f^3c,...,f^Nc}]]>经过归一化之后的特征向量具有尺度不变性;1.5)、对特征向量集进行平滑处理考虑到本方法时间序列相邻帧变化缓慢的特点,最终选择移动平均滤波器对关节点的每一维数据进行平滑滤波;移动平均滤波基于统计规律,将连续的图像帧看成一个长度固定为N的队列,然后对这个队列进行算术运算,并将其结果作为本次滤波的结果;平滑处理的步骤为:将特征向量集中,第一个关节点的第一维坐标按帧进行平滑滤波,滤波的窗口宽度为5,即:x‾11=x^11x‾12=(x^11+x^12+x^13)/3x‾13=(x^11+x^12+x^13+x^14+x^15)/5x‾14=(x^12+x^13+x^14+x^15+x^16)/5x‾14=(x^13+x^14+x^15+x^16+x^17)/5......x‾1N-2=(x^1N-4+x^1N-3+x^1N-2+x^1N-1+x^1N)/5x‾1N-1=(x^1N-2+x^1N-1+x^1N)/3x‾1N=x^1N]]>每一个关节点的每一维坐标都按上述方法进行平滑处理,经平滑处理之后,关节点的抖动被很好的处理了;1.6)、降采样为了降低手势特征向量集的元素数,对特征向量集进行二元采样,每隔一个元素提取一个元素,从而得到一个降采样特征向量集1.7)、差分处理对降采样之后的特征向量集的每一个特性向量的每一维进行一阶差分处理,用一阶差分的结果替换坐标值来描述手势随时间变化的位置特征趋势,差分如下:x·it=x‾it+1-x‾it]]>y·it=y‾it+1-y‾it]]>z·it=z‾it+1-z‾it]]>式中,分别表示经过前面七步处理之后的特征向量集第t帧的第i个关节点的x,y,z坐标;第c类标准手势经过预处理之后的特征向量集为:F·c={f·1c,f·2c,f·3c,...,f·Mc};]]>1.8)、计算特征向量集中各关节的权值选择逻辑斯蒂函数来为每个关节点计算它在标准手势中的权值:wic=21+e-(Dic-Dmaxc)/h,i∈[1,6];]]>其中,为关节点i的位移:Dic=Σt=2MSi(ftc,ft-1c)Si(ftc,ft-1c)=(x·it-x·it-1)2+(y·it-y·it-1)2+(z·it-z·it-1)2,]]>为关节点位移i∈[1,6]中的最大值,h为单位距离,根据实际情况确定;1.9)、计算特征向量集中元素各维的权值选取特征向量集中权值最大的三个关节点α,β,γ各帧对应的三维坐标组成一个新的特征向量集:Tc={{(x·α1,y·α1,z·α1),(x·β1,y·β1,zβ1),(x·γ1,y·γ1,z·γ1)},...{(x·αM,y·αM,z·αM),(x·βM,y·βM,z·βM),(x·γM,y·γM,z·γM)}};]]>分别计算特征向量集合Tc里每个关节点对应的x,y,z三维坐标的方差,其中,关节点α,β,γ的x维坐标的方差为:Dαc(x)=1MΣt=1M(x·αt-X‾α)2]]>Dβc(x)=1MΣt=1M(x·βt-X‾β)2]]>Dγc(x)=1MΣt=1M(x·γt-X‾γ)2]]>表示关节点α,β,γ在第t帧坐标的x维数据,表示特征向量集合Tc中关节点α,β,γ各自对应的所有x维坐标的平均值;当均小于阈值时,表示在标准手势中x维坐标是次要的,权值为0;当中有大于阈值的情况时,表示在标准手势中x维坐标是主要的,权值为1;对于y、z维坐标,采用同样的方法,得到其权值1.10)、构建标准手势样本库按照步骤1.1)~1.9)的方法,构造每个标准手势的特征向量集以及其中各关节点的权值、元素各维坐标的权值,生成标准手势样本库;(2)、识别阶段2.1)、采用步骤1.1)~1.7)的方法,从待识别视频中获取待识别手势的特征向量集2.2)、采用多维加权动态时间规整(MDW‑DTW)算法,计算出待识别手势的特征向量集分别与标准手势样本库中的各个标准手势的特征向量集c=1,2,…,C的动态规整距离(相似度),并进行比较,与待识别手势的特征向量集合动态规整距离最短(相似度最高)的特征向量集对应的标准手势类别即为待识别手势的类别,C标准手势类别总数;其中,多维加权动态时间规整算法中,代价矩阵C第(m,n)个元素s(m,n)的计算公式为:s(m,n)=Σi=16Σj=13((f·mtest(i,j)-f·nc(i,j))×wic×w^jc)2;]]>为待识别手势特征向量集中第m帧图像中第i个关节点对应坐标的第j维坐标,为标准手势样本库中标准手势c的特征向量集中第n帧图像中第i个关节点对应坐标的第j维坐标,j=1,2,3分别代表x,y,z;其中,动态规整距离为:DTW(F·test,F·c)=min{Σk=1Ls(mk,nk)};]]>其中,L为规整路径的长度,﹙mk,nk﹚为代价矩阵C中规整路径上的第k个元素坐标,分别代表待识别手势特征向量集中第mk帧,标准手势样本库中标准手势c的特征向量集中第nk帧。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410366945.5/,转载请声明来源钻瓜专利网。
- 上一篇:触控面板及其制作方法
- 下一篇:电磁音滤波电路以及直流风扇