[发明专利]一种基于相关滤波器的目标跟踪优化方法有效

专利信息
申请号: 201711037914.5 申请日: 2017-10-31
公开(公告)号: CN107862680B 公开(公告)日: 2019-12-10
发明(设计)人: 赵亦工;岑晓 申请(专利权)人: 西安电子科技大学
主分类号: G06T7/00 分类号: G06T7/00;G06T7/246
代理公司: 61218 西安睿通知识产权代理事务所(特殊普通合伙) 代理人: 惠文轩
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 相关 滤波器 目标 跟踪 优化 方法
【权利要求书】:

1.一种基于相关滤波器的目标跟踪优化方法,其特征在于,包括以下步骤:

步骤1,获取一个视频,所述视频包括T帧图片,每帧图片中分别包含一个目标,其中第1帧图片上目标位置已知,剩余T-1帧图片上各自目标位置未知;然后计算T帧图片目标搜索域区域;其中,T为大于或等于2的正整数;

步骤2,对第t'帧图片目标搜索域区域分别进行HOG特征和颜色特征的提取,分别得到第t'帧图片目标搜索域区域的HOG特征向量和第t'帧图片目标搜索域区域的颜色特征矩阵;1≤t′≤T,t'的初始值为1;

步骤3,令t'的值分别取1至T,重复步骤2,进而分别得到第1帧图片目标搜索域区域的HOG特征向量fHOG,1至第T帧图片目标搜索域区域的HOG特征向量fHOG,T,以及第1帧图片目标搜索域区域的颜色特征矩阵至第T帧图片目标搜索域区域的颜色特征矩阵;

初始化:令t∈{2,3,…,T},令表示第t帧图片目标搜索域区域,t的初始值为2;

步骤4,确定相关滤波器,并将第t帧图片目标搜索域区域的HOG特征向量和第t帧图片目标搜索域区域的颜色特征矩阵分别作为相关滤波器的输入,分别计算第t帧图片的HOG特征响应矩阵和第t帧图片的颜色特征响应矩阵与即为相关滤波器的输出,进而分别得到第t帧图片的HOG特征响应矩阵中的最大值,以及第t帧图片的颜色特征响应矩阵中的最大值;

步骤5,比较第t帧图片的HOG特征响应矩阵中的最大值,以及第t帧图片的颜色特征响应矩阵中的最大值,并选取大的最大值位置,作为第t帧图片的目标中心点

步骤6,令t的值加1,返回步骤4,直到得到第T帧图片的目标中心点后结束跟踪,至此得到了第2帧图片的目标中心点至第T帧图片的目标中心点以及根据第1帧图片上目标位置得到第1帧图片的目标中心点实现了T帧图片中每个目标的实时跟踪;

其中,在步骤1中,所述T帧图片目标搜索域区域,其过程为:

1.1 计算得到第1帧图片上目标的熵E(q1)与第2帧图片上第k-1次更新后目标搜索域区域的熵E(sk-1)之间的比R(k-1),其表达式为:

R(k-1)=E(q1)/E(sk-1)

其中,K为设定的搜索域更新次数最大值;k的初始值为1,sk-1表示第2帧图片上第k-1次更新后目标搜索域区域,pk-1,2,l表示第2帧图片内灰度值l在sk-1中出现的概率,log2表示底数为2的对数,b2表示第2帧图片中的灰度值最大值;p1i表示第1帧图片内灰度值i在q1中出现的概率,b1表示第1帧图片中的灰度值最大值,q1表示第1帧图片上目标大小;

1.2 令k的值加1,且令sk-1=sk-2-Q,返回1.1,直到得到第1帧图片上目标的熵E(q1)与第2帧图片上第K-1次更新后搜索域的熵E(sK-1)之间的比R(K-1)或者sk-1=1.2q1时停止更新,将停止更新时对应的第1帧图片上目标的熵与第2帧图片上第k-1次更新后搜索域的熵之间的比,记为第1帧图片上目标的熵E(q1)与第2帧图片上第k'次更新后搜索域的熵E(sk')之间的比R(k'),1≤k'≤K,k'表示停止更新时对应的更新次数;其中,Q为设定常数,0<Q<1;

1.3 根据第1帧图片上目标的熵E(q1)与第2帧图片上第k'次更新后目标搜索域区域的熵E(sk')之间的比R(k'),并通过如下公式得到第2帧图片上的最优目标搜索域区域,记为第2帧图片目标搜索域区域

其中,表示取最小时对应的j值,R(j-1)表示第1帧图片上目标的熵E(q1)与第2帧图片上第j-1次更新后目标搜索域区域的熵E(sj-1)之间的比,表示第2帧图片目标搜索域区域的最优更新次数,Q为设定常数,0<Q<1;令第1帧图片目标搜索域区域O表示设定整数,O>1;

1.4 令表示第t帧图片目标搜索域区域,qt-1表示第t-1帧图片上目标大小,t∈{2,3,…,T};

1.5 令t的值从2取至T,重复执行1.4,直到得到第T帧图片目标搜索域区域将第2帧图片目标搜索域区域至第T帧图片目标搜索域区域以及第1帧图片目标搜索域区域记为T帧图片目标搜索域区域,然后将t的值初始化为2;

在步骤2中,所述第t'帧图片目标搜索域区域的HOG特征向量和第t'帧图片目标搜索域区域的颜色特征矩阵,其得到过程为:

2.1 对第t'帧图片目标搜索域区域进行灰度化,得到灰度化后第t'帧图片目标搜索域区域;然后采用Gamma校正法对灰度化后第t'帧图片目标搜索域区域进行颜色空间的标准化,进而得到Gamma校正法后第t'帧图片目标搜索域区域,所述Gamma校正法后第t'帧图片目标搜索域区域中包括A×B个像素,A表示Gamma校正法后第t'帧图片目标搜索域区域的高,B表示Gamma校正法后第t'帧图片目标搜索域区域的宽;再计算Gamma校正法后第t'帧图片目标搜索域区域中A×B个像素的梯度,得到A×B个像素的梯度值;A、B分别为大于0的正整数;

2.2 将Gamma校正法后第t'帧图片目标搜索域区域中每C×C个像素分别作为一个cell,进而得到E个cell,表示向下取整;确定每个cell包含H个梯度方向,将每个cell的H个梯度方向分别记为对应cell的梯度直方图,进而得到E个cell的梯度直方图,每个cell的梯度直方图都为H×1维,将E个cell的梯度直方图作为E个cell的特征描述符;C、H分别为大于0的正整数;

2.3 将E个cell中每D×D个cell分别组成一个block,进而得到F个block,表示向下取整;将每个block内D×D个cell的特征描述符分别依次串接起来,进而得到F个block的HOG特征描述符,所述F个block的HOG特征描述符都为H×D维;D、F分别为大于0的正整数

将F个block的HOG特征描述符依次串接起来,得到第t'帧图片的HOG特征描述符,所述第t'帧图片的HOG特征描述符为H×D×F维;将第t'帧图片的HOG特征描述符按照block个数维依次串接,形成H×D维矩阵,所述H×D维矩阵为第t'帧图片目标搜索域区域的HOG特征向量fHOG,t'

2.4 对第t'帧图片目标搜索域区域进行RGB颜色特征提取,进而得到3个颜色特征向量,每个向量长度为I;其中3个颜色依次为红色red、绿色green、蓝色blue,I为大于0的正整数;

使用颜色映射方法对3个颜色特征向量进行颜色映射,进而得到11个颜色特征向量,每个颜色向量长度分别为I;其中11个颜色依次为黑色black、蓝色blue、棕色brown、绿色green、灰色grey、橙色orange、粉色pink、紫色purple、红色red、白色white、黄色yellow,得到11个颜色特征向量;

对11个颜色特征向量分别做快速傅里叶变换,再分别进行核映射,进而得到新的11个颜色特征向量,每个新的颜色特征向量长度都为I;

然后通过PCA降维方法对所述新的11个颜色特征向量进行降维处理,得到降维处理后的2个颜色特征向量,将降维处理后的2个颜色特征向量依次串接,得到一个I×2维矩阵,所述I×2维矩阵即为第t'帧图片目标搜索域区域的颜色特征矩阵fcolor,t'

在步骤4中,所述第t帧图片的HOG特征响应矩阵中的最大值,以及第t帧图片的颜色特征响应矩阵中的最大值,其得到过程为:

4.1 令yt-1表示第t-1帧图片上目标大小qt-1的二维高斯分布矩阵,大小为Mt-1×Nt-1;第1帧图片上目标大小q1的二维高斯分布矩阵大小至第T-1帧图片上目标大小qT-1的二维高斯分布矩阵大小取值分别相等;令yt-1(m,n)表示二维高斯分布矩阵yt-1上坐标(m,n)处的值,0≤m≤Mt-1,0≤n≤Nt-1,则yt-1(m,n)的计算公式为:

yt-1(m,n)=exp(-((m-Mt-1/2)2+(n-Nt-1/2)2)/σt-12),

其中,wt-1表示第t-1帧图片上目标大小qt-1的宽,ht-1表示第t-1帧图片上目标大小qt-1的高,exp表示指数函数;

计算得到第t帧图片目标搜索域区域的最优HOG拟合代价系数

其中,将满足时对应的值,记为第t帧图片目标搜索域区域的HOG拟合代价系数ωHOG,t;ε为小于1的常数,φ(xm,n)表示的核函数,表示第t帧图片目标搜索域区域的HOG特征向量fHOG,t中坐标(m1,n1)处的值,0≤m1≤H,0≤n1≤D;Mt-1表示二维高斯分布矩阵yt-1的行数,Nt-1表示二维高斯分布矩阵yt-1的列数,λ表示惩罚项系数;

计算得到第t帧图片目标搜索域区域的最优颜色拟合代价系数

其中,将满足时对应的值,记为第t帧图片搜索域目标区域的颜色拟合代价系数ωcolor,t;表示的核函数,表示第t帧图片目标搜索域区域的颜色特征矩阵fcolor,t中坐标(m2,n2)处的值,0≤m2≤I,0≤n2≤2;λ表示惩罚项系数;

4.2 分别设定第t帧图片目标搜索域区域的HOG系数矩阵为aHOG,t,设定第t帧图片目标搜索域区域的颜色系数矩阵为acolor,t,aHOG,t和acolor,t分别为Rt×Qt维,Rt与H取值相等,Qt与D取值相等;

对第t帧图片目标搜索域区域的HOG系数矩阵aHOG,t进行快速傅里叶变换:

其中,F(yt-1)表示对第t-1帧图片上目标大小qt-1的二维高斯分布矩阵yt-1做快速傅里叶变换,φ(fHOG,t-1)表示第t-1帧图片目标搜索域区域的HOG特征向量fHOG,t-1的核函数,F(φ(fHOG,t-1)×φ(fHOG,t-1))表示对两个相乘后的核函数做快速傅里叶变换,F(aHOG,t)表示对第t帧图片目标搜索域区域的HOG系数矩阵aHOG,t做快速傅里叶变换;

将F(aHOG,t)做逆快速傅里叶变换,得到第t帧图片目标搜索域区域的HOG系数矩阵aHOG,t

4.3 对第t帧图片目标搜索域区域的颜色系数矩阵acolor,t进行快速傅里叶变换:

其中,F(yt-1)表示对第t-1帧图片上目标大小qt-1的二维高斯分布矩阵yt-1做快速傅里叶变换,φ(fcolor,t-1)表示第t-1帧图片目标搜索域区域的颜色特征向量fcolor,t-1的核函数,F(φ(fcolor,t-1)×φ(fcolor,t-1))表示对φ(fcolor,t-1)和φ(fcolor,t-1)相乘后的核函数做快速傅里叶变换,F(acolor,t)表示对第t帧图片目标搜索域区域的颜色系数矩阵做快速傅里叶变换;

将F(acolor,t)做逆快速傅里叶变换,得到第t帧图片目标搜索域区域的颜色系数矩阵acolor,t

4.4 分别计算第t帧图片的HOG特征响应矩阵和第t帧图片的颜色特征响应矩阵

其中,表示第t帧图片的目标模板,qg表示第g帧图片上的目标大小;表示第t帧图片目标搜索域区域的核函数,表示第t帧目标模板的核函数,表示对和相乘后的结果进行快速傅里叶变换,⊙表示点乘,上标-1表示求逆;

4.5 分别找到第t帧图片的HOG特征响应矩阵和第t帧图片的颜色特征响应矩阵中的最大值,进而分别得到第t帧图片的HOG特征响应矩阵中的最大值YHOG,t,以及第t帧图片的颜色特征响应矩阵中的最大值Ycolor,t

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711037914.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top