[发明专利]一种动作识别方法有效
申请号: | 202110472752.8 | 申请日: | 2021-04-29 |
公开(公告)号: | CN113221693B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 杨剑宇;黄瑶 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06V10/762;G06V10/774;G06V10/82;G06N3/048;G06N3/08 |
代理公司: | 北京金宏来专利代理事务所(特殊普通合伙) 11641 | 代理人: | 刘慧红 |
地址: | 215131 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 动作 识别 方法 | ||
本发明提出一种动作识别方法,包括计算动作视频样本的动态图像;将动作视频样本的动态图像输入特征提取器,获取动态图像中的特征向量;构建特征中心组;将所有特征向量输入特征中心,累加每个特征中心上的所有输出,得到直方图表达;将直方图表达输入多层感知器,构成特征量化网络;训练特征量化网络至收敛,找出每个动作类别的共现特征中心组;构造图像特征共现层;构造基于共现图像特征的动作识别网络并训练至收敛,找出每个动作类别的共现图像特征神经元组;构造语义特征共现层;构造基于层级共现特征的动作识别网络并训练至收敛,计算测试动作视频样本的动态图像,输入训练好的基于层级共现特征的动作识别网络,实现动作识别。
技术领域
本发明涉及一种动作识别方法,属于动作识别技术领域。
背景技术
动作识别是计算机视觉领域的重要课题,它在视频监控、行为分析、人机交互等领域有着广泛的应用。随着社交网络的发展以及RGB设备的普及,基于RGB视频的动作识别得到了越来越多学者的关注。相比于基于骨骼的动作识别,基于RGB视频的动作识别更容易获取数据,可靠性更高。
大部分现有方法通过设计不同结构的深度卷积神经网络,提取视频中包含的深层特征,进行动作识别。这些方法通常忽略了提取的特征的可解释性,而且将堆叠的静态帧图像输入复杂的卷积神经网络,对计算机设备的性能要求较高。
因此,针对上述动作识别算法的问题,提出一种动作识别方法。
发明内容
本发明是为解决现有技术中的问题而提出的,技术方案如下,
一种动作识别方法,包括以下步骤:
步骤一、计算动作视频样本的动态图像;
步骤二、将动作视频样本的动态图像输入特征提取器,获取动态图像中的特征向量;
步骤三、构建特征中心组;将动作视频样本的动态图像的所有特征向量输入特征中心,累加每个特征中心上的所有输出,得到直方图表达;
步骤四、将直方图表达输入多层感知器,构成特征量化网络;
步骤五、将所有训练视频样本的动态图像输入特征量化网络,训练特征量化网络至收敛,找出每个动作类别的共现特征中心组;
步骤六、构造图像特征共现层;
步骤七、将图像特征共现层的输出输入多层感知器,构造基于共现图像特征的动作识别网络;
步骤八、所有训练动作视频样本的动态图像输入基于共现图像特征的动作识别网络,训练基于共现图像特征的动作识别网络至收敛,找出每个动作类别的共现图像特征神经元组;
步骤九、构造语义特征共现层;
步骤十、将语义特征共现层的输出输入多层感知器,构造基于层级共现特征的动作识别网络;
步骤十一、训练基于层级共现特征的动作识别网络至收敛,计算测试动作视频样本的动态图像,输入训练好的基于层级共现特征的动作识别网络,实现动作识别。
优选的,所述步骤一中,计算动作视频样本的动态图像的方法为:
每一个动作视频样本由该视频中的所有帧组成,对于任一动作视频样本A来说:
A={It|t∈[1,T]},
其中,t表示时间索引,T是动作视频样本A的总帧数;为动作视频样本A的第t帧图像的矩阵表示,R、C、3分别对应第t帧图像的矩阵表示的行数、列数和通道数,表示矩阵为实数矩阵;It中的每个元素表示第t帧图像的像素值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110472752.8/2.html,转载请声明来源钻瓜专利网。