[发明专利]从全局到类别特征表达学习的动作识别方法和系统有效
| 申请号: | 201811612590.8 | 申请日: | 2018-12-27 |
| 公开(公告)号: | CN109726671B | 公开(公告)日: | 2020-08-04 |
| 发明(设计)人: | 王延峰;赵培森;张娅 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 庄文莉 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 全局 类别 特征 表达 学习 动作 识别 方法 系统 | ||
1.一种从全局到类别特征表达学习的动作识别方法,其特征在于,包括:
全局特征提取步骤:对输入的动作视频,使用深度神经网络学习动作视频中的动作数据,提取得到全局特征表达;
类别结构关系获取步骤:通过提取到的全局特征表达,利用每个类别特征通道稀疏度之间的相似关系,获取各类别间的相似度结构关系;
类别特征掩膜获取步骤:对输入的每一类动作数据,使用全卷积深度神经网络学习所述动作数据对应的类别掩膜;
类别正则约束步骤:在学习类别掩膜的过程中,使用得到的各类别间的相似度结构关系对类别掩膜的相似程度进行约束;
类别特定特征提取步骤:对输入的动作视频,使用深度神经网络学习动作数据,提取类别特征,得到类别特征表达;
特征融合步骤:对提取的全局特征表达和类别特征表达进行融合,得到最终具有区分性的区别特征表达,以完成动作识别。
2.根据权利要求1所述的从全局到类别特征表达学习的动作识别方法,其特征在于,所述全局特征提取步骤中,全局特征表达的提取网络为2D和3D的组合卷积网络,在网络浅层使用2D卷积核,以节省计算和储存开销,在网络深层使用3D卷积核,以建模时间序列关系。
3.根据权利要求1所述的从全局到类别特征表达学习的动作识别方法,其特征在于,所述类别结构关系获取步骤中,类别特征通道稀疏度为数值在0到1之间的向量,以刻画输入深度神经网络的动作数据在不同通道上的响应强度;统计每个类别下所有样本的平均类别特征通道稀疏度,通过类别间通道稀疏度的关系来获取类别间的相似度结构关系。
4.根据权利要求3所述的从全局到类别特征表达学习的动作识别方法,其特征在于,所述类别结构关系获取步骤中,将全局特征表达定义为一个4维度的张量,所述4维度分别为C通道轴,T时间轴,H特征图高,W特征图宽;
对于每一个特征通道k,用下式计算对应通道的特征稀疏度:
Ξk=1-Qk
其中Ξk为对应通道k的通道相似度,Qk为通道k所对应的特征图上非零特征的响应比例;将所有通道的特征稀疏度组合起来,得到一个特征稀疏度向量Ξ,以表达样本在不同通道下的响应程度;统计每个类别下所有样本稀疏度向量的均值,得到对应类别的平均通道稀疏度Ξc,下标c表示对应的类别;
使用距离度量函数来度量不同类别的通道稀疏度距离,得到两种类别的通道稀疏度,所用公式如下:
si,j=1-dist(Ξi,Ξj)
其中si,j为类别i和j的通道相似度,dist(,)为归一化的距离度量函数,距离最近为0,最远为1;利用每类动作两两之间的通道相似度si,j得到通道稀疏度相似矩阵S=[si,j],i,j=1,2,…,M,其中M为动作类别数;
通过通道稀疏度相似矩阵S指导类别特征掩膜获取步骤以及类别正则约束步骤。
5.根据权利要求1所述的从全局到类别特征表达学习的动作识别方法,其特征在于,所述类别特征掩膜获取步骤中,在训练时,使用动作类别标签信息作为监督信息来训练全卷积神经网络,得到类别特征掩膜,特征掩膜是输入动作视频的动作类别在时空特征上所关注的区域;在测试时,对于每一个输入的动作数据使用学习到的特征掩膜,来筛选类别特定特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811612590.8/1.html,转载请声明来源钻瓜专利网。





