[发明专利]一种基于深度学习的多目标追踪系统及实现方法在审
申请号: | 201710053918.6 | 申请日: | 2017-01-22 |
公开(公告)号: | CN106875425A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 何志群;白洪亮;董远 | 申请(专利权)人: | 北京飞搜科技有限公司 |
主分类号: | G06T7/254 | 分类号: | G06T7/254;G06N3/08 |
代理公司: | 北京卓唐知识产权代理有限公司11541 | 代理人: | 龚洁 |
地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 多目标 追踪 系统 实现 方法 | ||
1.一种基于深度学习的多目标追踪方法,其特征在于包括如下步骤:
通过目标检测获得第一帧的目标位置,将多个待追踪目标加入到追踪队列中,
输入下一帧图片并遍历所述追踪队列,得到该目标在下一帧中的位置,
在得到上述目标在下一帧的位置之后,通过阈值判断该目标是否离开屏幕,
若否,则每隔一固定帧调用一次目标检测,将目标检测的结果与追踪的结果计算IOU交并比,
如果目标检测的一结果和追踪的所有目标的IOU<0.1,则认为新的目标加入了屏幕,将该目标加入追踪队列中;
如果IOU>0.5,则利用目标检测的框替代追踪的框,进行位置校正;
继续对目标进行追踪。
2.根据权利要求1所述的多目标追踪方法,其特征在于,还包括以下预训练过程:
将这两张图片通过尺度变换到同一个尺度,得到类似相邻视频帧的两种图片作为训练图片,对网络进行预训练。
3.根据权利要求2所述的多目标追踪方法,其特征在于,采用ILSVRC竞赛目标检测DET的图片作为上述训练图片。
4.根据权利要求2所述的多目标追踪方法,其特征在于,还包括以下训练过程:
首先将两张图片预处理之后通过参数相同的孪生网络提取图片特征;
其次,所述孪生网络通过稠密->稀疏->稠密的卷积神经网络提取图片特征;
然后,将两个特征相减作为融合的特征,然后再将该特征通过全连接层进行回归得到目标框的位置。
5.根据权利要求1所述的多目标追踪方法,其特征在于,在卷积神经网络的特征提取过程中采用CRELU联合修正线性单元。
6.根据权利要求1所述的多目标追踪方法,其特征在于,利用基于faster-rcnn框架的目标检测技术检测所述第一帧的目标位置。
7.根据权利要求1所述的多目标追踪方法,其特征在于,所述固定帧为10。
8.根据权利要求1所述的多目标追踪方法,其特征在于,判断目标是否离开屏幕阈值条件为:
h/w>threshold1、w/h>threshold2、|x1|/W<threshold3、|W-x2|/W<threshold3、|y1|/H<threshold4、|H-y1|/H<threshold4的阈值条件中的任一一种,
其中,threshold表示阈值,h和w分别为物体的高和宽,H和W分别为帧的高和宽,(x1,y1)为目标左上角的点坐标,(x2,y2)为目标右下角的点坐标。
9.根据权利要求7所述的多目标追踪方法,其特征在于,若多目标追踪为人脸追踪,则设threshold1=threshold2=2,threshold3=threshold4=0.02。
10.一种基于深度学习的多目标追踪系统,其特征在于,包括:
训练单元,用以进行目标检测获得第一帧的目标位置,将多个待追踪目标加入到追踪队列中;
检测单元,用以对输入的下一帧图片并遍历所述追踪队列,得到该目标在下一帧中的位置;以及在目标未离开屏幕时,每隔一固定帧调用一次目标检测;
追踪单元,用以在得到上述目标在下一帧的位置之后,通过阈值判断该目标是否离开屏幕即离开屏幕指目标物体已经不在图片中了离开屏幕指目标物体已经不在图片中了;
阈值单元,用以将目标检测的结果与追踪的结果计算IOU交并比,如果目标检测的一结果和追踪的所有目标的IOU<0.1,则认为新的目标加入了屏幕,将该目标加入追踪队列中;如果IOU>0.5,则利用目标检测的框替代追踪的框,进行位置校正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京飞搜科技有限公司,未经北京飞搜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710053918.6/1.html,转载请声明来源钻瓜专利网。