[发明专利]动作识别方法及装置有效
申请号: | 201710470470.8 | 申请日: | 2017-06-20 |
公开(公告)号: | CN109101858B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 胡越予;刘家瑛;张昊华;郭宗明 | 申请(专利权)人: | 北京大学;北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06V10/764;G06V10/40;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动作 识别 方法 装置 | ||
本发明提供的动作识别方法及装置确定接收视频数据中的目标帧和目标帧之前的连续若干帧,并在视频数据中提取该目标帧的数据信息和该目标帧之前的连续若干帧的数据信息。对预设个数的增益参数、目标帧的数据信息和目标帧之前的连续若干帧的数据信息进行预设次数的卷积处理,获得高阶特征数据,将该高阶特征数据添加至视频数据中,形成待提取数据,对待提取数据进行时序特征提取,获得特征向量,最后根据特征向量获取动作识别结果,从而可以提取到视频数据的高阶特征,进而提高动作识别的准确度。
技术领域
本发明涉及计算机视觉技术,尤其涉及一种动作识别方法及装置。
背景技术
随着计算机视觉技术的发展,利用视频采集设备进行动作识别成为研究重点。现有的动作识别方法需要从视频流中提取关节位置等数据,并将这些数据输入至三层双向长短时记忆循环人工神经网络中,由该神经网络提取数据的动态特征。随后,将提取出来的动态特征输入至分类器网络,最终获取与视频流的数据相应的动作类型。
但是,由于三层双向长短时记忆循环人工神经网络的局限性,其仅能提取数据在整个时序上的动态特征,无法提取数据在某一时刻的高阶特征。举例来说:在辨识“推”和“打”这两种位置数据较为相似的动作时,需要依靠“推”和“打”在某一时刻或连续若干时刻的“加速度”来进行区分。而在利用三层双向长短时记忆循环人工神经网络对“推”或“打”进行识别时,仅能提取到“平均加速度”这一动态特征,并不提取在“推”和“打”的动作发生瞬间以及该发生瞬间前后的“瞬时加速度”的动态特征。对于需要利用数据的高阶特征进行识别的动作类型,现有的动作识别方法不能实现对这类动作类型的准确识别。
发明内容
为了解决现有技术中存在的识别准确率低的技术问题,本发明提供了一种动作识别方法及装置。
一方面来说,本申请提供了一种动作识别方法,包括:
接收视频数据;
确定目标帧和所述目标帧之前的连续若干帧,并在所述视频数据中提取所述目标帧的数据信息和所述目标帧之前的连续若干帧的数据信息;
对预设个数的增益参数、所述目标帧的数据信息和所述目标帧之前的连续若干帧的数据信息进行预设次数的卷积处理,获得高阶特征数据;
将所述高阶特征数据添加至所述视频数据中,形成待提取数据;
对所述待提取数据进行时序特征提取,获得特征向量;
根据所述特征向量获取动作识别结果。
进一步的,所述接收视频数据之前,包括:
接收训练数据集,所述训练数据集包括若干训练数据以及每个训练数据对应的识别结果;
从所述训练数据集中选取一训练数据作为待训练数据;
确定所述待训练数据中的训练帧和所述训练帧之前的连续若干帧,并在所述待训练数据中提取所述训练帧的训练数据信息和所述训练帧之前的连续若干帧的训练数据信息;
对预设个数的待训练增益参数、所述训练帧的训练数据信息和所述训练帧之前的连续若干帧的训练数据信息进行预设次数的卷积处理,获得高阶特征训练数据;
将所述高阶特征训练数据添加至所述待训练数据中,形成待提取训练数据;
对所述待提取训练数据进行时序特征提取,获得所述待训练数据的训练特征向量;
根据所述训练特征向量获取预测结果;
获得所述待训练数据对应的识别结果和所述预测结果的交叉熵,并判断所述交叉熵是否收敛;
若收敛,则将所述待训练增益参数作为增益参数,并执行所述接收视频数据的步骤;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北大方正集团有限公司;北京北大方正电子有限公司,未经北京大学;北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710470470.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于二维码技术的铁钢包号识别系统
- 下一篇:使用高斯惩罚检测图像中行人的方法