[发明专利]一种基于相关滤波器的目标跟踪检测方法有效
| 申请号: | 201810292983.9 | 申请日: | 2018-03-30 |
| 公开(公告)号: | CN108596048B | 公开(公告)日: | 2020-05-19 |
| 发明(设计)人: | 赵亦工;岑晓 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
| 代理公司: | 西安睿通知识产权代理事务所(特殊普通合伙) 61218 | 代理人: | 惠文轩 |
| 地址: | 710071*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 相关 滤波器 目标 跟踪 检测 方法 | ||
1.一种基于相关滤波器的目标跟踪检测方法,其特征在于,包括以下步骤:
步骤1,获取一个视频,所述视频包括T帧图片,每帧图片中分别包含一个目标,其中第1帧图片上目标位置已知,剩余T-1帧图片上各自目标位置未知;然后计算T帧图片目标搜索域区域;其中,T为大于或等于2的正整数;
步骤2,对第t′帧图片目标搜索域区域分别进行HOG特征提取,得到第t′帧图片目标搜索域区域的HOG特征向量fHOG,t′;1≤t′≤T,t′的初始值为1;
步骤3,令t′的值分别取1至T,重复步骤2,进而分别得到第1帧图片目标搜索域区域的HOG特征向量fHOG,1至第T帧图片目标搜索域区域的HOG特征向量fHOG,T;
初始化:令t∈{2,3,…,T},令表示第t帧图片目标搜索域区域,t的初始值为2;设定常量阈值为
步骤4,确定相关滤波器,并将第t帧图片目标搜索域区域的HOG特征向量fHOG,t作为相关滤波器的输入,计算第t帧图片的HOG特征响应矩阵即为相关滤波器的输出,进而得到第t帧图片的HOG特征响应矩阵中的最大值;
步骤5,根据第t帧图片的HOG特征响应矩阵中的最大值和常量阈值得到第t帧图片的目标中心点
步骤6,令t的值加1,返回步骤4,直到得到第T帧图片的目标中心点后结束跟踪,至此得到了第2帧图片的目标中心点至第T帧图片的目标中心点以及根据第1帧图片上目标位置得到第1帧图片的目标中心点实现了T帧图片中每个目标的实时跟踪;
其中,在步骤1中,计算T帧图片目标搜索域区域,其过程为:
1.1计算得到第1帧图片上目标的熵E(q1)与第2帧图片上第k-1次更新后目标搜索域区域的熵E(sk-1)之间的比R(k-1),其表达式为:
R(k-1)=E(q1)/E(sk-1)
其中,1≤k≤K,K为设定的搜索域更新次数最大值;k的初始值为1,sk-1表示第2帧图片上第k-1次更新后目标搜索域区域,pk-1,2,l表示第2帧图片内灰度值l在sk-1中出现的概率,log2表示底数为2的对数,b2表示第2帧图片中的灰度值最大值;p1i表示第1帧图片内灰度值i在q1中出现的概率,b1表示第1帧图片中的灰度值最大值,q1表示第1帧图片上目标大小;
1.2令k的值加1,且令sk-1=sk-2-Q,返回1.1,直到得到第1帧图片上目标的熵E(q1)与第2帧图片上第k-1次更新后搜索域的熵E(sk-1)之间的比R(k-1)或者sk-1=1.2q1时停止更新,将停止更新时对应的第1帧图片上目标的熵与第2帧图片上第k-1次更新后搜索域的熵之间的比,记为第1帧图片上目标的熵E(q1)与第2帧图片上第k′次更新后搜索域的熵E(sk′)之间的比R(k′),1≤k′≤K,k′表示停止更新时对应的更新次数;其中,Q为设定常数,0<Q<1;
1.3根据第1帧图片上目标的熵E(q1)与第2帧图片上第k′次更新后目标搜索域区域的熵E(sk′)之间的比R(k′),并通过如下公式得到第2帧图片上的最优目标搜索域区域,记为第2帧图片目标搜索域区域
其中,表示取最小时对应的j值,R(j-1)表示第1帧图片上目标的熵E(q1)与第2帧图片上第j-1次更新后目标搜索域区域的熵E(sj-1)之间的比,表示第2帧图片目标搜索域区域的最优更新次数,Q为设定常数,0<Q<1;令第1帧图片目标搜索域区域O表示设定整数,O>1;
1.4令表示第t帧图片目标搜索域区域,qt-1表示第t-1帧图片上目标大小,t∈{2,3,…,T};
1.5令t的值从2取至T,重复执行1.4,直到得到第T帧图片目标搜索域区域将第2帧图片目标搜索域区域至第T帧图片目标搜索域区域以及第1帧图片目标搜索域区域记为T帧图片目标搜索域区域,然后将t的值初始化为2;
在步骤2中,所述第t′帧图片目标搜索域区域的HOG特征向量,其得到过程为:
2.1对第t′帧图片目标搜索域区域进行灰度化,得到灰度化后第t′帧图片目标搜索域区域;然后采用Gamma校正法对灰度化后第t′帧图片目标搜索域区域进行颜色空间的标准化,进而得到Gamma校正法后第t′帧图片目标搜索域区域,所述Gamma校正法后第t′帧图片目标搜索域区域中包括A×B个像素,A表示Gamma校正法后第t′帧图片目标搜索域区域的高,B表示Gamma校正法后第t′帧图片目标搜索域区域的宽;再计算Gamma校正法后第t′帧图片目标搜索域区域中A×B个像素的梯度,得到A×B个像素的梯度值;A、B分别为大于0的正整数;
2.2将Gamma校正法后第t′帧图片目标搜索域区域中每C×C个像素分别作为一个单元cell,进而得到月个单元cell,表示向下取整;确定每个单元cell包含H个梯度方向;将每个单元cell的H个梯度方向分别记为对应单元cell的梯度直方图,进而得到月个单元cell的梯度直方图,每个单元cell的梯度直方图都为H×1维;将月个单元cell的梯度直方图作为月个单元cell的特征描述符;C、H分别为大于0的正整数;
2.3将月个单元cell中每D×D个单元cell分别组成一个块block,进而得到F个块block,表示向下取整;将每个块block内D×D个单元cell的特征描述符分别依次串接起来,进而得到F个块block的HOG特征描述符,所述F个块block的HOG特征描述符都为H×D维;D、F分别为大于0的正整数;
将F个块block的HOG特征描述符依次串接起来,得到第t′帧图片的HOG特征描述符,所述第t′帧图片的HOG特征描述符为H×D×F维;将第t′帧图片的HOG特征描述符按照块block个数维依次串接,形成H×D维矩阵,所述H×D维矩阵为第t′帧图片目标搜索域区域的HOG特征向量fHOG,t′;
在步骤4中,所述第t帧图片的HOG特征响应矩阵以及所述第t帧图片的HOG特征响应矩阵中的最大值,其得到过程为:
4.1令yt-1表示第t-1帧图片上目标大小qt-1的二维高斯分布矩阵,大小为Mt-1×Nt-1;第1帧图片上目标大小q1的二维高斯分布矩阵大小至第T-1帧图片上目标大小qT-1的二维高斯分布矩阵大小取值分别相等;令yt-1(m,n)表示二维高斯分布矩阵yt-1上坐标(m,n)处的值,0≤m≤Mt-1,0≤n≤Nt-1,则yt-1(m,n)的计算公式为:
yt-1(m,n)=exp(-((m-Mt-1/2)2+(n-Nt-1/2)2)/σt-12),
其中,wt-1表示第t-1帧图片上目标大小qt-1的宽,ht-1表示第t-1帧图片上目标大小qt-1的高,exp表示指数函数;
计算得到第t帧图片目标搜索域区域的最优HOG拟合代价系数
其中,将满足时对应的值,记为第t帧图片目标搜索域区域的HOG拟合代价系数ωHOG,t;ε表示第一设定常数,表示的核函数,表示第t帧图片目标搜索域区域的HOG特征向量fHOG,t中坐标(m1,n1)处的值,0≤m1≤H,0≤n1≤D;yt-1(m,n)表示二维高斯分布矩阵yt-1上坐标(m,n)处的值,0≤m≤Mt-1,0≤n≤Nt-1,Mt-1表示二维高斯分布矩阵yt-1的行数,Nt-1表示二维高斯分布矩阵yt-1的列数;λ表示固定的二维高斯分布矩阵,大小为M×N,其中心点大小为0.0001,从中心点往各个方向数值逐渐减小,第一行与最后一行、第一列与最后一列的数值均为零;将固定的二维高斯分布矩阵λ上坐标(m2,n2)处的值记为λ(m2,n2),其表达式为:
λ(m2,n2)=exp(-((m2-M/2)2+(n2-N/2)2)/σ2)
其中,0≤m2≤M,0≤n2≤N,σ表示第二常数;
4.2设定第t帧图片目标搜索域区域的HOG系数矩阵为aHOG,t,aHOG,t为Rt×Qt维,Rt与H取值相等,Qt与D取值相等;
对第t帧图片目标搜索域区域的HOG系数矩阵aHOG,t进行快速傅里叶变换:
其中,F(yt-1)表示对第t-1帧图片上目标大小qt-1的二维高斯分布矩阵yt-1做快速傅里叶变换,φ(fHOG,t-1)表示第t-1帧图片目标搜索域区域的HOG特征向量fHOG,t-1的核函数,F(φ(fHOG,t-1)×φ(fHOG,t-1))表示对两个相乘后的核函数做快速傅里叶变换FFT;λ表示固定的二维高斯分布矩阵,大小为M×N;F(aHOG,t)表示对第t帧图片目标搜索域区域的HOG系数矩阵aHOG,t做快速傅里叶变换;
将F(aHOG,t)做逆快速傅里叶变换,得到第t帧图片目标搜索域区域的HOG系数矩阵aHOG,t;
4.3分别计算第t帧图片的HOG特征响应矩阵
其中,表示第t帧图片的目标模板,qg表示第g帧图片上的目标大小;表示第t帧图片目标搜索域区域的核函数,表示第t帧图片的目标模板的核函数,表示对和相乘后的结果进行快速傅里叶变换FFT,⊙表示点乘,表示对做逆快速傅立叶变换;
4.5找到第t帧图片的HOG特征响应矩阵中的最大值,记为第t帧图片的HOG特征响应矩阵中的最大值YHOG,t。
2.如权利要求1所述的一种基于相关滤波器的目标跟踪检测方法,其特征在于,在步骤5中,所述第t帧图片的目标中心点其得到过程为:
设定一个可以存放V个矩阵大小的数组ah,其中每一个矩阵都和第t帧图片目标搜索域区域的HOG系数矩阵aHOG,t大小一样;数组ah的大小为H×D×V,4≤V≤6;数组ah中的V个矩阵依次记为αah1,αah2,…,αahV;
当t取2至V+1时,将第2帧图片目标搜索域区域的HOG系数矩阵aHOG,2至第V+1帧图片目标搜索域区域的HOG系数矩阵aHOG,V+1分别对应作为数组ah中的V个矩阵,数组ah中的第1个矩阵αah1为第2帧图片目标搜索域区域的HOG系数矩阵aHOG,2,数组ah中的第2个矩阵αah2为第3帧图片目标搜索域区域的HOG系数矩阵aHOG,3,数组ah中的第V个矩阵αahV为第V+1帧图片目标搜索域区域的HOG系数矩阵aHOG,V+1;将第t帧图片的HOG特征响应矩阵中的最大值YHOG,t所在位置作为第t帧图片的目标中心点
当t≥V+2时,比较第t帧图片的HOG特征响应矩阵中的最大值YHOG,t与阈值的大小,若则将第t帧图片的HOG特征响应矩阵中的最大值YHOG,t所在位置作为第t帧图片的目标中心点并将第t帧图片目标搜索域区域的HOG系数矩阵aHOG,t与数组ah中的第γ个矩阵αahγ进行替换,2≤γ≤V,γ的初始值为2,令γ的值加1;当γ取值为V时,替换后γ的值变为2;其中,数组ah中的第1个矩阵αah1不会被替换;
若则计算得到V个响应矩阵,其中第u个响应矩阵为其表达式为:
其中,表示第t帧图片的目标模板,qg表示第g帧图片上的目标大小;表示第t帧图片目标搜索域区域的核函数,表示第t帧图片的目标模板的核函数,表示对和相乘后的结果进行快速傅里叶变换,⊙表示点乘,表示对做逆快速傅立叶变换,F(aahu)表示对数组ah中的第u个矩阵αahu进行快速傅里叶变换,1≤u≤V,V表示设定正整数,4≤V≤6;
然后分别找到V个响应矩阵中的最大值,分别记为第1个响应矩阵中的最大值Yah1、第2个响应矩阵中的最大值Yah2、…、第V个响应矩阵中的最大值YahV,比较V个响应矩阵中的最大值,选取其中最大的一个最大值所在位置作为第t帧图片的目标中心点
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810292983.9/1.html,转载请声明来源钻瓜专利网。





