[发明专利]动作识别方法及装置有效

申请号：	201710470470.8	申请日：	2017-06-20
公开（公告）号：	CN109101858B	公开（公告）日：	2022-02-18
发明（设计）人：	胡越予;刘家瑛;张昊华;郭宗明	申请（专利权）人：	北京大学;北大方正集团有限公司;北京北大方正电子有限公司
主分类号：	G06V40/20	分类号：	G06V40/20;G06V20/40;G06V10/764;G06V10/40;G06V10/82;G06N3/04;G06N3/08
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	杨泽;刘芳
地址：	100871***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	动作识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供的动作识别方法及装置确定接收视频数据中的目标帧和目标帧之前的连续若干帧，并在视频数据中提取该目标帧的数据信息和该目标帧之前的连续若干帧的数据信息。对预设个数的增益参数、目标帧的数据信息和目标帧之前的连续若干帧的数据信息进行预设次数的卷积处理，获得高阶特征数据，将该高阶特征数据添加至视频数据中，形成待提取数据，对待提取数据进行时序特征提取，获得特征向量，最后根据特征向量获取动作识别结果，从而可以提取到视频数据的高阶特征，进而提高动作识别的准确度。

技术领域

本发明涉及计算机视觉技术，尤其涉及一种动作识别方法及装置。

背景技术

随着计算机视觉技术的发展，利用视频采集设备进行动作识别成为研究重点。现有的动作识别方法需要从视频流中提取关节位置等数据，并将这些数据输入至三层双向长短时记忆循环人工神经网络中，由该神经网络提取数据的动态特征。随后，将提取出来的动态特征输入至分类器网络，最终获取与视频流的数据相应的动作类型。

但是，由于三层双向长短时记忆循环人工神经网络的局限性，其仅能提取数据在整个时序上的动态特征，无法提取数据在某一时刻的高阶特征。举例来说：在辨识“推”和“打”这两种位置数据较为相似的动作时，需要依靠“推”和“打”在某一时刻或连续若干时刻的“加速度”来进行区分。而在利用三层双向长短时记忆循环人工神经网络对“推”或“打”进行识别时，仅能提取到“平均加速度”这一动态特征，并不提取在“推”和“打”的动作发生瞬间以及该发生瞬间前后的“瞬时加速度”的动态特征。对于需要利用数据的高阶特征进行识别的动作类型，现有的动作识别方法不能实现对这类动作类型的准确识别。

发明内容

为了解决现有技术中存在的识别准确率低的技术问题，本发明提供了一种动作识别方法及装置。

一方面来说，本申请提供了一种动作识别方法，包括：

接收视频数据；

确定目标帧和所述目标帧之前的连续若干帧，并在所述视频数据中提取所述目标帧的数据信息和所述目标帧之前的连续若干帧的数据信息；

对预设个数的增益参数、所述目标帧的数据信息和所述目标帧之前的连续若干帧的数据信息进行预设次数的卷积处理，获得高阶特征数据；

将所述高阶特征数据添加至所述视频数据中，形成待提取数据；

对所述待提取数据进行时序特征提取，获得特征向量；

根据所述特征向量获取动作识别结果。

进一步的，所述接收视频数据之前，包括：

接收训练数据集，所述训练数据集包括若干训练数据以及每个训练数据对应的识别结果；

从所述训练数据集中选取一训练数据作为待训练数据；