[发明专利]一种基于3D卷积神经网络的动作检测方法有效
申请号: | 201810313649.7 | 申请日: | 2018-04-10 |
公开(公告)号: | CN108734095B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 宋佳蓉;杨忠;胡国雄;韩家明;张天翼;朱家远 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V40/10;G06V10/764;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 曹芸 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于3D卷积神经网络的动作检测方法,属于计算机视觉识别技术领域。该方法包括如下步骤:首先,将视频分为多个有重叠的片段,采用训练好的3D卷积神经网络提取每个片段的高维时‑空特征,并采用多类softmax分类器对提取到的特征进行预测分类,再进一步对分类结果在时间维度上进行平滑滤波;其次,设定背景阈值,并将每个片段的背景得分与设定的阈值进行比较,得到属于动作片段的集合;最终,结合动作片段集合和帧率信息实现对动作在时间维度上的定位,从而得到视频对应的动作类别和该动作的起始时间片段集合。本发明实现端对端动作检测,提高检测结果的可靠性。 | ||
搜索关键词: | 一种 基于 卷积 神经网络 动作 检测 方法 | ||
【主权项】:
1.一种基于3D卷积神经网络的动作检测方法,其特征在于,包括如下步骤:S1:将视频分为多个有重叠的视频片段,每个视频片段由连续L帧图片组成;S2:利用训练好的3D卷积神经网络提取每个片段的高维时‑空特征,并对提取到的特征进行预测分类;S3:对S2中结果在时间维度上进行均值滤波,得到均值滤波处理后的各片段类别得分;S4:对S3中所有片段类别得分进行统计,得到视频的动作类别;S5:利用S3中的结果,对每个片段进行背景和动作二分类,得到属于动作的片段集合;S6:对S5中集合元素进行合并;S7:根据视频帧率和S6中动作片段集合,对动作在时间维度上进行定位,得到动作起始时间片段集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810313649.7/,转载请声明来源钻瓜专利网。