[发明专利]一种基于跨域深度卷积神经网络的视觉目标跟踪方法在审

申请号：	202011334712.9	申请日：	2020-11-24
公开（公告）号：	CN112465862A	公开（公告）日：	2021-03-09
发明（设计）人：	张科;王无为;王靖宇;谭明虎;苏雨	申请（专利权）人：	西北工业大学
主分类号：	G06T7/246	分类号：	G06T7/246;G06N3/04;G06N3/08
代理公司：	西北工业大学专利中心 61204	代理人：	金凤
地址：	710072 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度卷积神经网络视觉目标跟踪方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于跨域深度卷积神经网络的视觉目标跟踪方法，其特征在于，包括以下步骤：

步骤1：构建深度卷积神经网络模型；

采用VGG网络架构，只保留VGG网络架构的前三个卷积层Conv1-Conv3和两个全连接层FC4-FC5，在第二个全连接层FC5之后连接多域全连接层；

多域全连接层的每个域对应于一个训练序列中的单个目标，并由一个用于区分目标和背景的二值分类层和一个用于定位的边界框回归层组成；多域全连接层的层数N_b等于训练集序列的个数；

步骤2：在N_b个训练集序列中随机取出1个序列，构建N_pos个正样本、N_neg个负样本和N_hard个难例负样本作为当前mini-batch的输入；其中正样本表示样本框与对应目标真实位置的重叠率大于设定阈值λ₁的样本；负样本表示与真实位置的重叠率小于定阈值λ₁且大于定阈值λ₂的样本；难例负样本表示从其他序列取得且与当前序列的目标为同一类别的正样本；

步骤3：将N_pos+N_neg+N_hard个样本作为深度卷积神经网络模型的输入，输入尺寸为(N_pos+N_neg+N_hard)×a₁×a₂×a₃，并根据以下式(1)损失函数计算深度卷积神经网络模型输出的损失，然后根据损失更新网络参数：

其中，P_i和T_i分别表示深度卷积神经网络模型第i个分支中分类层和回归层的输出，Y_i和B_i分别表示对应的样本标签和回归真值，和分别表示二值分类损失函数以及回归损失函数，超参数λ₁控制和之间的平衡度；

步骤4：在每个mini-batch结束后重复步骤2到步骤3，直到达到预先设定的训练次数N_batch；

步骤5：利用步骤1到步骤4训练的深度卷积神经网络模型进行在线目标跟踪；

步骤5-1给定序列图像I_k，k＝1，2，…，n中的第一帧I₁，以及目标的初始矩形框B₁，在目标周围采集N_pos个正样本及N_neg个负样本；

步骤5-2：确定检测精度P，P的取值范围为(b₁，b₂)；对序列图像I_k中的每一幅图像使用滑动窗口策略进行搜索，从图像左上角起，横向和纵向每隔N/4个像素取N×N大小的图像块B，作为样本输入深度卷积神经网络模型，若深度卷积神经网络模型计算出B是目标的概率大于P，则标记出B的位置为目标；

步骤5-3：第二帧及后续的每一帧中，以上一帧目标的位置为中心，选取M_c个候选样本作为输入，深度卷积神经网络模型输出各个候选样本的正分类得分f⁺(xⁱ)以及边界框偏移量；通过找到最大得分对应的候选样本x^*及其边界框偏移量得到当前帧的最优目标位置；x^*计算公式如下：

2.根据权利要求1所述的一种基于跨域深度卷积神经网络的视觉目标跟踪方法，其特征在于，所述a₁＝107，a₂＝107，a₃＝3。

3.根据权利要求1所述的一种基于跨域深度卷积神经网络的视觉目标跟踪方法，其特征在于，所述b₁＝0，b₂＝1。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北工业大学，未经西北工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011334712.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种节能环保的污水处理初沉池浮渣打捞装置
下一篇：一种治疗脑胶质瘤的间质内放疗装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于跨域深度卷积神经网络的视觉目标跟踪方法在审

专利文献下载