[发明专利]一种基于3D深度卷积网络的人类行为识别的方法有效
申请号: | 201710697809.8 | 申请日: | 2017-08-15 |
公开(公告)号: | CN107506712B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 高联丽;宋井宽;王轩瀚;邵杰;申洪宇 | 申请(专利权)人: | 成都考拉悠然科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 夏艳 |
地址: | 610015 四川省成都市高新*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于计算机视觉视频动作识别领域,公开了一种基于3D深度卷积网络的人类行为识别的方法,所述方法首先将一个视频划分为一系列连续的视频片段;然后,将连续的视频片段输入到由卷积计算层和时空金字塔池化层组成的3D神经网络得到连续的视频片段特征;然后通过长短记忆模型计算全局的视频特征作为行为模式。本发明技术具有明显优势,通过改进了标准的3维卷积网络C3D,引入多级池化能够对任意分辨率和时长的视频片段进行特征提取;同时提高模型对行为变化大的鲁棒性,有利于在保持视频质量的情况下增加视频训练数据规模;通过各个运动子状态进行关联性信息嵌入提高行为信息的完整性。 | ||
搜索关键词: | 一种 基于 深度 卷积 网络 人类 行为 识别 方法 | ||
【主权项】:
一种基于3D深度卷积网络的人类行为识别的方法,其特征在于,所述基于3D深度卷积网络的人类行为识别的方法首先将一个视频划分为一系列连续的视频片段;然后,将连续的视频片段输入到由卷积计算层和时空金字塔池化层组成的3D神经网络得到连续的视频片段特征;然后通过长短记忆模型计算全局的视频特征作为行为模式。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都考拉悠然科技有限公司,未经成都考拉悠然科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710697809.8/,转载请声明来源钻瓜专利网。