[发明专利]人体动作识别方法、装置、终端设备及存储介质有效
申请号: | 201811509445.7 | 申请日: | 2018-12-11 |
公开(公告)号: | CN109522874B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 程俊;姬晓鹏;赵青松 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人体 动作 识别 方法 装置 终端设备 存储 介质 | ||
本申请实施例适用于模式识别技术领域,公开了一种人体动作识别方法、装置、终端设备及计算机可读存储介质,其中,方法包括:获取人体动作的深度图像序列;将深度图像序列等间隔划分为预设数量个图像序列片段;对每个图像序列片段进行时序稀疏采样,得到对应的目标图像序列;提取每个目标图像序列的梯度方向向量;根据梯度方向向量和预训练的三维卷积神经网络模型,进行人体动作识别。本申请实施例的时空信息描述能力较强,识别性能较高,计算较简便。
技术领域
本申请属于模式识别技术领域,尤其涉及一种人体动作识别方法、装置、终端设备及计算机可读存储介质。
背景技术
随着深度卷积神经网络技术的不断发展,使得利用深度神经网络来解决基于图像序列的动作识别和行为建模问题得以实现。
目前,结合深度图像序列和卷积神经网络的人体动作识别方法可以分为基于二维卷积神经网络和基于三维卷积神经网络两种。在基于二维卷积神经网络的识别方法中,首先对深度图像序列的时序信息进行压缩,然后采用二维卷积神经网络对运动轨迹图像进行特征学习和分类,得到识别结果。但是,该方法中对深度图像序列中人体的表观信息和运动信息的时空能力描述并不强,并很大程度上依赖于网络数据输入前精心的时序处理工作,使得该方法的识别效率和准确率较低。在基于三维卷积神经网络的识别方法中,采用原始深度数据作为网络输入,虽然可以在一定程度上加强时空信息的描述能力,但是,对局部时空的运动线索描述能力有限。
也就是说,现有的基于图像序列和卷积神经网络的人体动作识别方法存在时空信息描述能力不强,识别性能较低等问题。
发明内容
有鉴于此,本申请实施例提供一种人体动作识别方法、装置、终端设备及计算机可读存储介质,以解决现有人体动作识别方法的时空信息描述能力不强,识别性能较低的问题。
本申请实施例的第一方面提供一种人体动作识别方法,包括:
获取人体动作的深度图像序列;
将所述深度图像序列等间隔划分为预设数量个图像序列片段;
对每个所述图像序列片段进行时序稀疏采样,得到对应的目标图像序列;
提取每个所述目标图像序列的梯度方向向量;
根据所述梯度方向向量和预训练的三维卷积神经网络模型,进行人体动作识别。
结合第一方面,在一种可行的实现方式中,所述对每个所述图像序列片段进行时序稀疏采样,得到对应的目标图像序列,包括:
从每个所述图像序列片段中抽取第一目标深度图像、第二目标深度图像以及第三目标深度图像,其中,所述第一目标深度图像、所述第二目标深度图像以及所述第三目标深度图像在所述深度图像序列中的时序相对位置呈等差数列;
基于每个所述图像序列片段的所述第一目标深度图像、所述第二目标深度图像以及所述第三目标深度图像,得到对应的所述目标图像序列。
结合第一方面,在一种可行的实现方式中,所述提取每个所述目标图像序列的梯度方向向量,包括:
分别计算每个所述目标图像序列的梯度分量;
将每个所述目标图像序列的所述梯度分量进行L2范数归一化,得到每个所述目标图像序列的所述梯度方向向量。
结合第一方面,在一种可行的实现方式中,在所述提取每个所述目标图像序列的梯度方向向量之前,还包括:
对每个所述目标图像序列进行数据增强操作。
结合第一方面,在一种可行的实现方式中,所述对每个所述目标图像序列进行数据增强操作,包括:
对各个深度图像的预设区域进行裁剪,得到相应的第一预设尺寸的第一目标区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811509445.7/2.html,转载请声明来源钻瓜专利网。