[发明专利]一种基于多级特征的双学习模型目标跟踪方法有效
申请号: | 201811405327.1 | 申请日: | 2018-11-23 |
公开(公告)号: | CN109543615B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 张建明;金晓康;李旭东;陆朝铨 | 申请(专利权)人: | 长沙理工大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06T7/11;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京旭路知识产权代理有限公司 11567 | 代理人: | 姚自奇;莫舒颖 |
地址: | 410114 湖南省长*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多级 特征 学习 模型 目标 跟踪 方法 | ||
1.一种基于多级特征的双学习模型目标跟踪方法,其特征在于,针对目标视频序列,在给定第一帧中目标初始状态的情况下,在后面的视频序列中估计目标的状态,具体包括如下步骤:
A1、读取目标视频序列,获得第t帧图像中的目标位置,t=1;
A2、在第t+1帧图像中裁剪出包含有所述目标位置的候选区域;
提取所述候选区域中卷积层的深度特征和所述候选区域的低级特征,将每一所述卷积层中深度特征的输出和低级特征的输出作为目标的多通道卷积神经网络的特征图M、N分别为特征图的宽和高,D为通道个数;
A3、训练相关滤波器模型:
将所述候选区域分为若干cell小块,针对每一cell小块建立高斯函数标签Y:
通过所述高斯函数标签Y和特征图Xl,构建多通道卷积神经网络中每一层、每一特征通道的相关滤波器;
根据所述相关滤波器获得所述每一层、每一特征通道的特征图;
根据所述每一层、每一特征通道的特征图获得每一层特征图的相关响应图和每一层特征图的相关响应图中最大响应值所在的位置;
A4、预测目标位置:
将当前层的最大响应值与前一层的最大响应值加权得到前一层最大响应值的位置,通过迭代,得到最终响应图;
在最终响应图中找到最大响应值,将最大响应值的位置作为目标的预测位置;
A5、分类器模型重检测,根据每一层特征图的相关响应图获得第t+1帧图像的HPSR指标;
当HPSR指标大于或等于设定阈值θ时,所述目标的预测位置作为目标的最终位置;
当HPSR指标小于设定阈值θ时,启用分类器模型,将分类器模型获得的结果与目标的预测位置相结合,得到第t+1帧图像目标的最终位置;
A6、双模型的更新,实时在线更新相关滤波器模型和分类器模型,用于第t+2帧图像的目标位置确定;所述步骤A6包括:
A61、更新相关滤波器模型,更新第t+1帧的分子和分母从而更新第t+1帧的相关滤波器
其中,η为学习率;
A62、更新分类器模型,在第t+1帧的目标位置附近以目标大小的窗口收集正负样本,提取特征后进行在线SVM训练;
当给定的训练数据集为G={(xSVM,j,ySVM,j),j=1,...r},r为样本的个数,xSVM,j为训练样本,ySVM,j为样本标签,若样本的包围框面积为m,第t+1帧的目标包围框为n,他们的重叠率s=(m∩n)/(m∪n),当s0.5时为正样本,s0.1时为负样本,训练的目标函数为:
更新完成后,用于第t+2帧目标位置的确定。
2.根据权利要求1所述的双学习模型目标跟踪方法,其特征在于,所述候选区域为第t帧图像中以目标位置为中心的2.5倍区域。
3.根据权利要求1所述的双学习模型目标跟踪方法,其特征在于,所述步骤A2中的深度特征包括高级特征和中级特征;
提取卷积层Conv3-4、卷积层Conv4-4、卷积层Conv5-4的特征图,作为高级特征;
提取卷积层Conv1-2、卷积层Conv2-2的特征图,作为中级特征。
4.根据权利要求1所述的双学习模型目标跟踪方法,其特征在于,所述步骤A2中的低级特征包括HOG特征、Gray特征和Color Name特征,将上述的三种特征联在一起,作为低级特征。
5.根据权利要求1所述的双学习模型目标跟踪方法,其特征在于,
在提取深度特征和低级特征之前,将所述候选区域的图像进行单精度处理和重采样,归一化后计算出均值,再对图像去均值;
利用VGGNet-19预训练的网络模型对所述候选区域进行特征提取,提取不同卷积层的深度特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙理工大学,未经长沙理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811405327.1/1.html,转载请声明来源钻瓜专利网。