[发明专利]基于SSD网络的视频目标检测方法及装置在审
申请号: | 201911370916.5 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111160229A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 尉婉青;禹晶;柏鳗晏;肖创柏 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郑朝然 |
地址: | 100022 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ssd 网络 视频 目标 检测 方法 装置 | ||
1.一种基于SSD网络的视频目标检测方法,其特征在于,包括:
将待检测视频的当前数据帧和邻近帧,分别输入至预设的SSD网络模型的低层卷积,进行特征提取;
通过光流网络获取每一邻近帧和当前帧的光流场;
根据每一邻近帧特征提取后的低层特征和当前帧的光流场,获得当前帧的多个光流补偿特征;
根据当前帧的低层特征和所述多个光流补偿特征,进行特征融合,得到当前帧的时间融合特征;
将所述当前帧的时间融合特征,输入高层卷积进行特征提取,输出当前帧的检测结果;
其中,所述SSD网络模型根据带有目标类别和坐标位置标签的视频样本进行训练后得到。
2.根据权利要求1所述的基于SSD网络的视频目标检测方法,其特征在于,所述根据当前帧的低层特征和所述多个光流补偿特征,进行特征融合,包括:
计算当前帧的低层特征,分别和所述多个光流补偿特征的余弦相似度,并进行归一化;
根据归一化的余弦相似度,对当前帧的低层特征和所述多个光流补偿特征进行加权,得到当前帧的时间融合特征。
3.根据权利要求1所述的基于SSD网络的视频目标检测方法,其特征在于,所述将所述当前帧的时间融合特征,输入高层卷积进行特征提取之后,所述输出当前帧的检测结果之前,还包括:
利用高层卷积得到的特征依次进行上采样,得到与每个不同尺度的低层特征相同维度的待融合特征;
将每个不同尺度的低层特征与待融合特征进行特征融合后进行检测。
4.根据权利要求1所述的基于SSD网络的视频目标检测方法,其特征在于,将待检测视频的当前数据帧和邻近帧,分别输入至预设的SSD网络模型的低层卷积之前,还包括:
获取多个已知目标类别和坐标位置的视频数据和图片数据,得到第一训练集样本;
利用所述第一训练集样本对所述SSD网络模型的多个卷积层进行训练,直至收敛或到达最大迭代次数;
获取多个已知目标类别和坐标位置的视频数据,得到第二训练集样本;
对于每一第二训练样本,将当前帧和邻近帧,对加入光流网络的SSD网络模型进行训练,直至收敛或到达最大迭代次数。
5.根据权利要求1所述的基于SSD网络的视频目标检测方法,其特征在于,所述根据每一邻近帧特征提取后的低层特征和当前帧的光流场,获得当前帧的多个光流补偿特征,包括:
根据每一邻近帧特征提取后的低层特征和当前帧的光流场,通过双线性插值函数,获得当前帧的多个光流补偿特征。
6.根据权利要求1所述的基于SSD网络的视频目标检测方法,其特征在于,所述SSD网络模型为加入ResNet101网络构建得到。
7.根据权利要求4所述的基于SSD网络的视频目标检测方法,其特征在于,所述已知目标类别和坐标位置的视频数据和图片数据分别为,ImageNet VID数据集和ImageNet DET数据集中的数据。
8.一种基于SSD网络的视频目标检测装置,其特征在于,包括:
输入模块,用于将待检测视频的当前数据帧和邻近帧,分别输入至预设的SSD网络模型的低层卷积,进行特征提取;
光流获取模块,用于通过光流网络获取每一邻近帧和当前帧的光流场;
特征补偿模块,用于根据每一邻近帧特征提取后的低层特征和当前帧的光流场,获得当前帧的多个光流补偿特征;
特征融合模块,用于根据当前帧的低层特征和所述多个光流补偿特征,进行特征融合,得到当前帧的时间融合特征;
处理模块,用于将所述当前帧的时间融合特征,输入高层卷积进行特征提取,输出当前帧的检测结果;
其中,所述SSD网络模型根据带有目标类别和坐标位置标签的视频样本进行训练后得到。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于SSD网络的视频目标检测方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述基于SSD网络的视频目标检测方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911370916.5/1.html,转载请声明来源钻瓜专利网。