[发明专利]基于层次动态深度投影差值图像表示的视频行为识别方法及系统有效
申请号: | 201811327041.6 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109460734B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 马昕;武寒波;荣学文;宋锐;田新诚;田国会;李贻斌 | 申请(专利权)人: | 山东大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于层次动态深度投影差值图像(HDDPDI)表示的视频行为识别方法及系统,首先把深度视频序列分别投影在三个正交的笛卡尔平面内生成对应的深度投影图序列,来捕捉人体行为的3D轮廓和运动特征,每个投影平面中基于深度投影图序列来构建对应的HDDPDI。HDDPDI能够同时编码视频中行为的时空运动动态。CNN可以自动学习图像中的差异特征。为了验证所提出HDDPDI视频表示的有效性,构造了一个基于CNN的行为识别框架,其中设计了三种行为分类方案。三个投影平面内的HDDPDI分别单独输入三个相同的预训练CNN进行网络参数的微调,不同的分类方案使用CNN不同的网络层以比较它们对行为识别的影响,每一种分类方案中融合三个投影平面的信息以获取更加丰富全面的行为特征表示。 | ||
搜索关键词: | 基于 层次 动态 深度 投影 差值 图像 表示 视频 行为 识别 方法 系统 | ||
【主权项】:
1.一种基于层次动态深度投影差值图像表示的视频行为识别方法,其特征在于,包括:对于一个深度视频序列,在三个正交的笛卡尔平面中分别进行投影得到对应平面的深度投影图序列;根据每一个投影平面内的深度投影图序列,构建深度视频在该平面内的层次动态深度投影差值图像表示。层次动态深度投影差值图像表示能够从不同的时间尺度同时编码视频中行为的时空运动动态,包含了丰富的行为运动信息;将深度视频在三个投影平面内生成的层次动态深度投影差值图像表示分别输入三个相同的预训练后的卷积神经网络CNN中,分别提取CNN三个不同网络层的输出;对于每一个网络层输出,融合三个投影平面的行为信息进行分类与识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811327041.6/,转载请声明来源钻瓜专利网。