[发明专利]一种针对视觉跟踪模型的人在回路训练方法及相关装置在审
申请号: | 202110546714.2 | 申请日: | 2021-05-19 |
公开(公告)号: | CN113192108A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 吕娜;崔志岩;王玮丰;黄彦浩;裘微江;李文臣 | 申请(专利权)人: | 西安交通大学;中国电力科学研究院有限公司;国网浙江省电力有限公司 |
主分类号: | G06T7/246 | 分类号: | G06T7/246 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 李红霖 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 视觉 跟踪 模型 回路 训练 方法 相关 装置 | ||
1.一种针对视觉跟踪模型的人在回路训练方法,其特征在于,包括如下步骤:
S1,从已构建的初始训练样本待标注集中随机选择一部分样本进行人工标注,将人工标注的样本构成初始训练集;其中,初始训练样本待标注集通过视频序列进行构建;
S2,利用初始训练集训练视觉跟踪模型,得到初步训练的跟踪模型;
S3,利用所述初步训练的跟踪模型对初始训练样本待标注集中未标注的样本进行处理,并根据所述初步训练的跟踪模型输出的响应图生成伪标签图片;
S4,根据所述伪标签图片和初步训练的跟踪模型输出的响应图,利用交叉熵损失函数,生成伪损失;
S5,依据所述伪损失,对初始训练样本待标注集中未标注的样本进行排序,选择损失较大的若干样本;
S6,以人在回路的方式对所选择的损失较大的若干样本进行人工标注,并将人工标注后的样本加入初始训练集,得到新的训练集;
S7,使用新的训练集重新训练所述视觉跟踪模型,训练完成后得到训练好的视觉跟踪模型。
2.根据权利要求1所述的一种针对视觉跟踪模型的人在回路训练方法,其特征在于,S1中,所述视频序列中的样本应包含多种物体类别、尺度、姿态、光照以及遮挡情况;
S1和S6中,对样本进行人工标注时,标示出样本中目标物的位置和尺度。
3.根据权利要求1所述的一种针对视觉跟踪模型的人在回路训练方法,其特征在于,S3中,据所述初步训练的跟踪模型输出的响应图生成伪标签图片的过程包括:
令响应图中与最大值距离不大于t的所有像素点的像素值为1,令响应图中其它部分像素点的像素值为0,得到伪标签图片;
其中,t=(0.1-0.3)h,h为响应图的边长。
4.根据权利要求1所述的一种针对视觉跟踪模型的人在回路训练方法,其特征在于,S4中,伪损失通过下式计算:
loss=-∑(p*log(r)+(1-p)log(1-r))
上式中,loss为整个响应图的伪损失,r为响应图中的像素值,p为生成的伪标签图片中的标签值,∑()表示对响应图上所有点的损失进行求和,求和结果为整个响应图的伪损失。
5.根据权利要求1所述的一种针对视觉跟踪模型的人在回路训练方法,其特征在于,S1中,从初始训练样本待标注集中随机选择一部分样本进行人工标注时,选择的样本数量为初始训练样本待标注集中样本数量的1%-5%;S6中,选择损失较大的若干样本时,选择的样本数量为初始训练样本待标注集中未标注的样本数量的1%-5%。
6.根据权利要求1所述的一种针对视觉跟踪模型的人在回路训练方法,其特征在于,利用初始训练集训练视觉跟踪模型时,直到视觉跟踪模型收敛到局部最优解,得到初步训练的跟踪模型;
使用新的训练集重新训练所述视觉跟踪模型时,直到视觉跟踪模型收敛到局部最优解,得到训练好的视觉跟踪模型。
7.根据权利要求1-6任意一项所述的一种针对视觉跟踪模型的人在回路训练方法,其特征在于,还包括如下步骤:
S8,对S7得到的训练好的视觉跟踪模型按照S3-S7重复训练若干次,直到标注的样本数量达到预设的数量或者视觉跟踪模型的精度达到预设要求,则停止训练,得到最终的视觉跟踪模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;中国电力科学研究院有限公司;国网浙江省电力有限公司,未经西安交通大学;中国电力科学研究院有限公司;国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110546714.2/1.html,转载请声明来源钻瓜专利网。