[发明专利]一种基于跨域深度卷积神经网络的视觉目标跟踪方法在审
| 申请号: | 202011334712.9 | 申请日: | 2020-11-24 |
| 公开(公告)号: | CN112465862A | 公开(公告)日: | 2021-03-09 |
| 发明(设计)人: | 张科;王无为;王靖宇;谭明虎;苏雨 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/04;G06N3/08 |
| 代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 卷积 神经网络 视觉 目标 跟踪 方法 | ||
1.一种基于跨域深度卷积神经网络的视觉目标跟踪方法,其特征在于,包括以下步骤:
步骤1:构建深度卷积神经网络模型;
采用VGG网络架构,只保留VGG网络架构的前三个卷积层Conv1-Conv3和两个全连接层FC4-FC5,在第二个全连接层FC5之后连接多域全连接层;
多域全连接层的每个域对应于一个训练序列中的单个目标,并由一个用于区分目标和背景的二值分类层和一个用于定位的边界框回归层组成;多域全连接层的层数Nb等于训练集序列的个数;
步骤2:在Nb个训练集序列中随机取出1个序列,构建Npos个正样本、Nneg个负样本和Nhard个难例负样本作为当前mini-batch的输入;其中正样本表示样本框与对应目标真实位置的重叠率大于设定阈值λ1的样本;负样本表示与真实位置的重叠率小于定阈值λ1且大于定阈值λ2的样本;难例负样本表示从其他序列取得且与当前序列的目标为同一类别的正样本;
步骤3:将Npos+Nneg+Nhard个样本作为深度卷积神经网络模型的输入,输入尺寸为(Npos+Nneg+Nhard)×a1×a2×a3,并根据以下式(1)损失函数计算深度卷积神经网络模型输出的损失,然后根据损失更新网络参数:
其中,Pi和Ti分别表示深度卷积神经网络模型第i个分支中分类层和回归层的输出,Yi和Bi分别表示对应的样本标签和回归真值,和分别表示二值分类损失函数以及回归损失函数,超参数λ1控制和之间的平衡度;
步骤4:在每个mini-batch结束后重复步骤2到步骤3,直到达到预先设定的训练次数Nbatch;
步骤5:利用步骤1到步骤4训练的深度卷积神经网络模型进行在线目标跟踪;
步骤5-1给定序列图像Ik,k=1,2,…,n中的第一帧I1,以及目标的初始矩形框B1,在目标周围采集Npos个正样本及Nneg个负样本;
步骤5-2:确定检测精度P,P的取值范围为(b1,b2);对序列图像Ik中的每一幅图像使用滑动窗口策略进行搜索,从图像左上角起,横向和纵向每隔N/4个像素取N×N大小的图像块B,作为样本输入深度卷积神经网络模型,若深度卷积神经网络模型计算出B是目标的概率大于P,则标记出B的位置为目标;
步骤5-3:第二帧及后续的每一帧中,以上一帧目标的位置为中心,选取Mc个候选样本作为输入,深度卷积神经网络模型输出各个候选样本的正分类得分f+(xi)以及边界框偏移量;通过找到最大得分对应的候选样本x*及其边界框偏移量得到当前帧的最优目标位置;x*计算公式如下:
2.根据权利要求1所述的一种基于跨域深度卷积神经网络的视觉目标跟踪方法,其特征在于,所述a1=107,a2=107,a3=3。
3.根据权利要求1所述的一种基于跨域深度卷积神经网络的视觉目标跟踪方法,其特征在于,所述b1=0,b2=1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011334712.9/1.html,转载请声明来源钻瓜专利网。





