[发明专利]基于ReID特征的强数据关联一体化实时多目标跟踪方法有效

专利信息
申请号: 202011347428.5 申请日: 2020-11-26
公开(公告)号: CN112487934B 公开(公告)日: 2022-02-01
发明(设计)人: 周雪;梁超;邹见效;徐红兵 申请(专利权)人: 电子科技大学
主分类号: G06V40/10 分类号: G06V40/10;G06V10/80;G06V10/82;G06K9/62;G06N3/04
代理公司: 成都行之专利代理事务所(普通合伙) 51220 代理人: 温利平
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 reid 特征 数据 关联 一体化 实时 多目标 跟踪 方法
【权利要求书】:

1.一种基于ReID特征的强数据关联一体化实时多目标跟踪方法,其特征在于,包括以下步骤:

S1:构建检测跟踪一体化模型,包括检测器模块、K个不同尺度的互相关网络CCN模块、K个不同尺度的检测头部模块和尺度感知注意力网络SAAN模块,K表示检测器模块输出的特征图尺度数量,其中:

检测器模块用于将输入图像编码为K个不同尺度的高阶语义特征图Fk,k=1,2,…,K,然后分别输入至对应尺度的互相关网络CCN模块;

互相关网络CCN模块对于对输入的特征图Fk进行分离处理,得到特征图Gk,1和特征图Gk,2,然后将特征图Gk,1发送给对应尺度的检测头部模块,将特征图Gk,2发送给尺度感知注意力网络SAN模块;互相关网络CCN模块包括平均池化层、输入图像维度变换层、第一卷积层、第一维度变换层、第一通道注意力层、第二卷积层、第二维度变换层、第二通道注意力层、第三通道注意力层、第四通道注意力层、第一通道注意力图融合层、第一图像增强层、第三维度变换层、第二通道注意力图融合层、第二图像增强层和第四维度变换层,其中:

平均池化层用于对输入的对应尺度的特征图Fk进行平均池化操作得到特征图F′k,记特征图Fk的大小为Ck×Hk×Wk,其中Ck表示特征图Fk的通道数量,Hk×Wk表示特征图Fk中单通道特征图的大小,记特征图F′k的大小为Ck×H′k×W′k,其中H′k×W′k表示特征图F′k中单通道特征图的大小,H′k<Hk且W′k<Wk;平均池化层将得到的特征图F′k分别发送给第一卷积层和第二卷积层;

输入图像维度变换层用于将输入的大小为Ck×Hk×Wk的特征图Fk转换为大小为Ck×Nk的输入图像数据矩阵F″k,其中Nk=Hk×Wk,然后分别发送给第一图像增强层和第二图像增强层;

第一卷积层用于对输入的特征图F′k进行卷积操作得到大小为Ck×H′k×W′k的特征图Tk,1,然后发送给第一维度变换层;

第一维度变换层用于对输入的大小为Ck×H′k×W′k的特征图Tk,1转换为大小为Ck×N′k的数据矩阵Mk,1,其中N′k=Hk×Wk,然后发送给第一通道注意力层、第三通道注意力层和第四通道注意力层;

第一通道注意力层用于采用行向softmax根据输入的数据矩阵Mk,1计算得到大小为Ck×Ck的通道注意力图Wk,1,然后发送给第一通道注意力图融合层,通道注意力图Wk,1中每个像素值wk,1(i,j)的计算公式如下:

其中,(i,j)表示像素点坐标,i,j=1,2,…,C,Mk,1[i]、Mk,1[j]表示数据矩阵Mk,1中第i行、第j行向量,exp表示以自然常数e为底的指数函数;

第二卷积层用于对输入的特征图F′k采用与第一卷积层不同的参数进行卷积操作得到大小为Ck×H′k×W′k的特征图Tk,2,然后发送给第二维度变换层;

第二维度变换层用于对输入的大小为Ck×H′k×W′k的特征图Tk,2转换为大小为Ck×N′k的数据矩阵Mk,2,然后分别发送给第二通道注意力层、第三通道注意力层和第四通道注意力层;

第二通道注意力层用于采用行向softmax根据输入的数据矩阵Mk,2计算得到大小为Ck×Ck的通道注意力图Wk,2,然后发送给第二通道注意力图融合层,通道注意力图Wk,2中每个像素值wk,2(i,j)的计算公式如下:

其中,Mk,2[i]、Mk,2[j]表示数据矩阵Mk,2中第i行、第j行向量;

第三通道注意力层用于采用行向softmax根据输入的数据矩阵Mk,1和数据矩阵Mk,2计算得到大小为Ck×Ck的通道注意力图Wk,3,然后发送给第一通道注意力图融合层,通道注意力图Wk,3中每个像素值wk,3(i,j)的计算公式如下:

第四通道注意力层用于采用行向softmax根据输入的数据矩阵Mk,1和数据矩阵Mk,2计算得到大小为Ck×Ck的通道注意力图Wk,4,然后发送给第二通道注意力图融合层,通道注意力图Wk,4中每个像素值wk,4(i,j)的计算公式如下:

第一通道注意力图融合层用于对通道注意力图Wk,1和通道注意力图Wk,3进行加权融合,得到大小为Ck×Ck的融合通道注意力图W′k,1,然后发送给第一图像增强层,融合通道注意力图W′k,1的计算公式如下:

W′k,1=λkWk,1+(1-λk)Wk,3

其中,λk表示权重参数;

第一图像增强层用于对接收到的大小为Ck×Nk的输入图像数据矩阵F″k和大小为Ck×Ck的融合通道注意力图W′k,1进行矩阵乘法,得到大小为Ck×Nk增强的图像数据矩阵G′k,1=W′k,1·F″k,然后输入至第三维度变换层;

第三维度变换层将大小为Ck×Nk增强的图像数据矩阵G′k,1转换为大小为Ck×Hk×Wk的特征图Gk,1,然后发送给对应尺度的检测头部模块;

第二通道注意力图融合层用于对通道注意力图Wk,2和通道注意力图Wk,4进行加权融合,得到大小为Ck×Ck的融合通道注意力图W′k,2,然后发送给第二图像增强层,融合通道注意力图W′k,2的计算公式如下:

W′k,2=λkWk,2+(1-λk)Wk,4

第二图像增强层用于对接收到的大小为Ck×Nk的输入图像数据矩阵F″k和大小为Ck×Ck的融合通道注意力图W′k,2进行矩阵乘法,得到大小为Ck×Nk增强的图像数据矩阵G′k,2=W′k,2·F″k,然后输入至第四维度变换层;

第四维度变换层将大小为Ck×Nk增强的图像数据矩阵G′k,2转换为大小为Ck×Hk×Wk的特征图Gk,2,然后发送给对应尺度的尺度感知注意力网络SAAN模块;

检测头部模块用于对接收到的对应尺度的特征图Gk,1进行目标检测,得到该尺度下的目标检测框;

尺度感知注意力网络SAAN模块用于根据接收到的K个特征图Gk,2得到目标的ReID特征向量;尺度感知注意力网络SAAN模块包括K个尺度分支处理模块、通道拼接层、通道注意力模块、拼接特征图处理层和特征向量层,其中:

尺度分支处理模块用于采用空间注意力机制对对应尺度特征图Gk,2进行处理,得到特征图Qk,2;尺度分支处理模块包括尺度变换层、卷积层、空间注意力模块、掩膜层,其中尺度变换层用于将大小为Ck×Hk×Wk的特征图Gk,2变换至最大尺度,得到大小为的特征图G″k,2,然后发送给卷积层和掩膜层;

卷积层用于对特征图G″k,2进行卷积操作得到大小为的特征图Pk,2,然后发送给空间注意力模块和掩膜层;

空间注意力模块用于对特征图Pk,2生成空间注意力的掩膜图maskk,2,然后发送给掩膜层;

掩膜层用于采用空间注意力的掩膜图maskk,2对特征图Pk,2进行掩膜处理得到特征图Qk,2,然后发送给通道拼接层;

通道拼接层用于将每个尺度分支处理模块得到的特征图Qk,2拼接为大小为的拼接特征图Q2,然后发送给通道注意力模块和拼接特征图处理层;

通道注意力模块用于根据拼接特征图Q2生成维度为的通道注意力向量,发送给拼接特征图处理层;

拼接特征图处理层用于计算拼接特征图Q2中每个像素点的通道向量与通道注意力向量进行对应元素相乘,然后将所得到的特征图与拼接特征图Q2相加,得到特征图Q′2,然后发送给特征向量层;

特征向量层用于对特征图Q′2进行卷积操作得到大小为的特征图I,目标的ReID特征即为特征图I中目标像素点的通道向量;

S2:根据需要设置训练样本集,对步骤S1构建的跟踪一体化模型进行训练;

S3:对于需要进行多目标跟踪的视频序列中的每一帧图像,均采用检测跟踪一体化模型获取当前帧的目标检测结果和ReID特征,采用预设的跟踪机制基于目标检测结果和ReID特征获取各个目标的跟踪结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011347428.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top