[发明专利]基于多分支自编码对抗网络的高效目标跟踪方法有效
申请号: | 201910452361.2 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110189362B | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 王菡子;吴强强;刘祎 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/04;G06N3/08;G06T7/277 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分支 编码 对抗 网络 高效 目标 跟踪 方法 | ||
1.基于多分支自编码对抗网络的高效目标跟踪方法,其特征在于包括以下步骤:
1)在有标记的离线目标跟踪数据集中收集大量目标模板和包含有目标的搜索区域样本对;
2)使用均方误差损失,通过全监督的方式对所提出的目标概率生成器进行初步训练,具体方法如下:
L(rm,n,Gz,s)=||rm,n-Gz,s||2
其中,Gz,s为目标概率生成器所输出的目标概率分布图,rm,n则表示标签目标概率分布,其中,x,y∈{1,...,128},H和W分别表示目标的高和宽;z和s分别表示目标模板和目标搜索区域,m和n为目标样本在搜索区域s中的中心位置坐标;σ设置为4×10-1;
3)引入判别器,加入对抗训练的方式共同优化目标概率生成器和判别器,使得目标概率生成器学习到更具有判别力的特征,具体过程如下:
其中,D为判别器,λ为平衡对抗损失和均方损失的超参数;
4)给定测试视频中的第一帧,采样其标注的目标区域作为初始目标模板;
5)给定测试帧,以当前目标长宽的N倍大小的窗口进行随机的位移来得到搜索区域;
6)将搜索区域和目标模板输入目标概率生成器,输出得到目标概率图,选取目标概率图中最大值点的位置作为目标中心,确定目标中心过程如下:
其中,Gz,s(x,y)表示生成的目标概率图在(x,y)位置处的值;
7)根据目标概率图分布估计目标在当前帧的尺度,尺度估计过程描述如下:首先令K表示尺度的数量,对于评估其对应的目标尺度,其中,高为ekHt-1,宽为ekWt-1,e为尺度因子,其过程如下:
其中,最终,目标在当前第t帧中的尺度估计为:
8)根据当前帧估计的目标区域进行目标模板更新。
2.如权利要求1所述基于多分支自编码对抗网络的高效目标跟踪方法,其特征在于在步骤1)中,所述在有标记的离线目标跟踪数据集中收集大量目标模板和包含有目标的搜索区域样本对的具体方法为:在有标注的离线目标跟踪数据集中,选取任意视频序列a,在a中,首先选取第t帧中的目标作为目标模板,然后将第t帧作为起始帧,在后50帧内随机选取一帧得到目标搜索区域样本;通过上述方式,收集大量的目标模板和目标搜索区域样本对;所述有标记的离线目标跟踪数据集为ILSVRC-VID视频目标检测数据集。
3.如权利要求1所述基于多分支自编码对抗网络的高效目标跟踪方法,其特征在于在步骤3)中,所述λ为10-4。
4.如权利要求1所述基于多分支自编码对抗网络的高效目标跟踪方法,其特征在于在步骤4)中,所述给定测试视频中的第一帧,采样其标注的目标区域作为初始目标模板的具体方法为:根据测试视频中第一帧中标记的目标区域,采样得到目标模板,并采用双线性插值将目标模板大小调整为255×255×3。
5.如权利要求1所述基于多分支自编码对抗网络的高效目标跟踪方法,其特征在于在步骤5)中,所述N为2.5。
6.如权利要求1所述基于多分支自编码对抗网络的高效目标跟踪方法,其特征在于在步骤7)中,所述K为33,e为1.02;η为2.5×10-1。
7.如权利要求1所述基于多分支自编码对抗网络的高效目标跟踪方法,其特征在于在步骤8)中,所述根据当前帧估计的目标区域进行目标模板更新的具体方法为:令为(t-1)帧的目标模板,使用学习率w来更新得到第t帧的目标模板:
其中,w为5×10-3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910452361.2/1.html,转载请声明来源钻瓜专利网。