[发明专利]动作识别方法、装置、设备及存储介质在审

申请号：	202010850142.2	申请日：	2020-08-21
公开（公告）号：	CN111931679A	公开（公告）日：	2020-11-13
发明（设计）人：	李岩;康斌	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	王兆林
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	动作识别方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了一种动作识别方法、装置、设备及存储介质，该方法包括：将待识别的视频序列划分为T个视频段；通过特征提取网络提取T个视频段各自对应的图像特征；根据T个视频段各自对应的图像特征间的差异度，对T个视频段各自对应的图像特征进行特征融合处理，得到目标视频特征；根据目标视频特征确定视频序列中运动目标的动作类别。该方法能够保证准确识别视频序列中运动目标的动作类别。

技术领域

本申请涉及人工智能(Artificial Intelligence，AI)技术领域，尤其涉及一种动作识别方法、装置、设备及存储介质。

背景技术

基于视频的动作识别任务，是指识别一段视频序列中运动目标进行的动作所属的类别。与普通的图片分类任务仅需考虑单张图片不同，基于视频的动作识别任务需要更多地考量时间维度的信息，才能准确地识别视频序列中运动目标的动作类别，例如，对于不同泳姿的区分，往往需要综合考虑时间序列内多张图片的信息才能做出准确地判断。

相关技术目前主要基于通道偏移算法(Temporal Shift Moduel，TSM)实现基于视频的动作识别任务，该TSM算法在特征提取网络中加入了时间维度的特征融合策略，可以针对相邻视频段间的图像特征进行特征融合处理，从而在时间维度上实现特征信息的交换与特征信息的融合。

然而，经本申请发明人研究发现，上述实现方式往往难以保证交换融合的特征信息中包含参考价值较高的时间信息，这对于最终动作识别结果的准确性也会产生影响。

发明内容

本申请实施例提供了一种动作识别方法、装置、设备及存储介质，能够保证准确识别视频序列中运动目标的动作类别。

有鉴于此，本申请第一方面提供了一种动作识别方法，所述方法包括：

获取待识别的视频序列；

将所述视频序列划分为T个视频段，所述T为大于1的整数；

通过特征提取网络对所述T个视频段进行特征提取处理，得到所述T个视频段各自对应的图像特征；

根据所述T个视频段各自对应的图像特征之间的差异度，对所述T个视频段各自对应的图像特征进行特征融合处理，得到目标视频特征；

根据所述目标视频特征，确定所述视频序列中运动目标的动作类别。

本申请第二方面提供了一种动作识别装置，所述装置包括：

视频获取模块，用于获取待识别的视频序列；