[发明专利]训练目标跟踪模型和目标跟踪的方法和装置有效
申请号: | 202111464709.3 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114169425B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 倪烽;王冠中;党青青;邓凯鹏;赖宝华;刘其文;于佃海;胡晓光;马艳军 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06T7/246;G06V10/774;G06V10/75 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 目标 跟踪 模型 方法 装置 | ||
本公开提供了训练目标跟踪模型和目标跟踪的方法和装置,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:获取样本集,样本包括视频帧和真实框;构建目标跟踪模型,其中,目标跟踪模型的头部包括交并比头,用于计算交并比损失值;执行如下训练步骤:从样本集中选取样本;将选取的样本中的视频帧输入目标跟踪模型,输出预测框;根据选取的样本中的真实框和预测框的差异计算原始损失值和交并比损失值;若原始损失值和交并比损失值的加权和小于预定阈值,则确定出目标跟踪模型训练完成;否则,调整目标跟踪模型的网络参数,继续执行训练步骤。通过该实施方式能够提高生成的目标跟踪模型的跟踪精度和速度。
技术领域
本公开涉及人工智能领域,尤其涉及深度学习领域,具体涉及训练目标跟踪模型和目标跟踪的方法和装置。
背景技术
多目标跟踪技术(Multi-Object Tracking)是给定视频图像序列,定位出多个感兴趣的目标,并在连续帧之间维持个体的ID信息和记录其轨迹。多目标跟踪技术是计算机视觉领域中最重要,且最复杂的任务之一,被应用到如自动驾驶、安防巡检、智慧城市等领域。
相较于目标检测技术仅针对当前静止时刻输出目标的定位信息,多目标跟踪技术增加了一维目标的个体ID信息,利用这个ID信息可以构建出帧和帧之间的联系,从而识别出相邻帧中的同一物体。从应用场景角度看,更能理解两个任务的差异。物体检测的场景像钢筋计数、工业质检、电力巡检、麦穗检测等,都是只需要检测出物体在某个瞬间某个点某个静止时刻的状态。而目标跟踪的场景像智慧交通、医疗分析、牲畜盘点、军事勘察等,都是需要持续追踪物体的连续运动状态,所以这些任务并不能用目标检测代替去做。
发明内容
本公开提供了一种训练目标跟踪模型和目标跟踪的方法、装置、设备、存储介质以及计算机程序产品。
根据本公开的第一方面,提供了一种训练目标跟踪模型的方法,包括:获取样本集,其中,所述样本集中的样本包括视频帧和用于标注所述视频帧中目标对象的真实框;构建目标跟踪模型,其中,所述目标跟踪模型的头部包括交并比头,用于计算交并比损失值;执行如下训练步骤:从所述样本集中选取样本;将选取的样本中的视频帧输入所述目标跟踪模型,输出预测框;根据选取的样本中的真实框和所述预测框的差异计算原始损失值和交并比损失值;若所述原始损失值和所述交并比损失值的加权和小于预定阈值,则确定出所述目标跟踪模型训练完成;否则,调整所述目标跟踪模型的网络参数,继续执行所述训练步骤。
根据本公开的第二方面,提供了一种目标跟踪方法,包括:获取待检测的视频帧集合;将所述视频帧集合输入根据第一方面所述的方法训练完成的目标跟踪模型,在每个视频帧中输出至少一个检测框;对于每个视频帧,根据检测框的得分将该视频帧中的检测框划分成高分框集合和低分框集合;对于每个视频帧,将该视频帧的高分框集合与之前已确定的跟踪轨迹进行第一次匹配,将第一次匹配失败的跟踪轨迹与该视频帧的低分框集合进行第二次匹配,得到更新后的跟踪轨迹。
根据本公开的第三方面,提供了一种训练目标跟踪模型的装置,包括:获取单元,被配置成获取样本集,其中,所述样本集中的样本包括视频帧和用于标注所述视频帧中目标对象的真实框;构建单元,被配置成构建目标跟踪模型,其中,所述目标跟踪模型的头部包括交并比头,用于计算交并比损失值;训练单元,被配置成执行如下训练步骤:从所述样本集中选取样本;将选取的样本中的视频帧输入所述目标跟踪模型,输出预测框;根据选取的样本中的真实框和所述预测框的差异计算原始损失值和交并比损失值;若所述原始损失值和所述交并比损失值的加权和小于预定阈值,则确定出所述目标跟踪模型训练完成;调整单元,被配置成否则,调整所述目标跟踪模型的网络参数,继续执行所述训练步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111464709.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种眼镜
- 下一篇:尿液蛋白标志物在诊断遗传性血管水肿中的用途