[发明专利]基于ReID特征的强数据关联一体化实时多目标跟踪方法有效
| 申请号: | 202011347428.5 | 申请日: | 2020-11-26 |
| 公开(公告)号: | CN112487934B | 公开(公告)日: | 2022-02-01 |
| 发明(设计)人: | 周雪;梁超;邹见效;徐红兵 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/80;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 reid 特征 数据 关联 一体化 实时 多目标 跟踪 方法 | ||
1.一种基于ReID特征的强数据关联一体化实时多目标跟踪方法,其特征在于,包括以下步骤:
S1:构建检测跟踪一体化模型,包括检测器模块、K个不同尺度的互相关网络CCN模块、K个不同尺度的检测头部模块和尺度感知注意力网络SAAN模块,K表示检测器模块输出的特征图尺度数量,其中:
检测器模块用于将输入图像编码为K个不同尺度的高阶语义特征图Fk,k=1,2,…,K,然后分别输入至对应尺度的互相关网络CCN模块;
互相关网络CCN模块对于对输入的特征图Fk进行分离处理,得到特征图Gk,1和特征图Gk,2,然后将特征图Gk,1发送给对应尺度的检测头部模块,将特征图Gk,2发送给尺度感知注意力网络SAN模块;互相关网络CCN模块包括平均池化层、输入图像维度变换层、第一卷积层、第一维度变换层、第一通道注意力层、第二卷积层、第二维度变换层、第二通道注意力层、第三通道注意力层、第四通道注意力层、第一通道注意力图融合层、第一图像增强层、第三维度变换层、第二通道注意力图融合层、第二图像增强层和第四维度变换层,其中:
平均池化层用于对输入的对应尺度的特征图Fk进行平均池化操作得到特征图F′k,记特征图Fk的大小为Ck×Hk×Wk,其中Ck表示特征图Fk的通道数量,Hk×Wk表示特征图Fk中单通道特征图的大小,记特征图F′k的大小为Ck×H′k×W′k,其中H′k×W′k表示特征图F′k中单通道特征图的大小,H′k<Hk且W′k<Wk;平均池化层将得到的特征图F′k分别发送给第一卷积层和第二卷积层;
输入图像维度变换层用于将输入的大小为Ck×Hk×Wk的特征图Fk转换为大小为Ck×Nk的输入图像数据矩阵F″k,其中Nk=Hk×Wk,然后分别发送给第一图像增强层和第二图像增强层;
第一卷积层用于对输入的特征图F′k进行卷积操作得到大小为Ck×H′k×W′k的特征图Tk,1,然后发送给第一维度变换层;
第一维度变换层用于对输入的大小为Ck×H′k×W′k的特征图Tk,1转换为大小为Ck×N′k的数据矩阵Mk,1,其中N′k=Hk×Wk,然后发送给第一通道注意力层、第三通道注意力层和第四通道注意力层;
第一通道注意力层用于采用行向softmax根据输入的数据矩阵Mk,1计算得到大小为Ck×Ck的通道注意力图Wk,1,然后发送给第一通道注意力图融合层,通道注意力图Wk,1中每个像素值wk,1(i,j)的计算公式如下:
其中,(i,j)表示像素点坐标,i,j=1,2,…,C,Mk,1[i]、Mk,1[j]表示数据矩阵Mk,1中第i行、第j行向量,exp表示以自然常数e为底的指数函数;
第二卷积层用于对输入的特征图F′k采用与第一卷积层不同的参数进行卷积操作得到大小为Ck×H′k×W′k的特征图Tk,2,然后发送给第二维度变换层;
第二维度变换层用于对输入的大小为Ck×H′k×W′k的特征图Tk,2转换为大小为Ck×N′k的数据矩阵Mk,2,然后分别发送给第二通道注意力层、第三通道注意力层和第四通道注意力层;
第二通道注意力层用于采用行向softmax根据输入的数据矩阵Mk,2计算得到大小为Ck×Ck的通道注意力图Wk,2,然后发送给第二通道注意力图融合层,通道注意力图Wk,2中每个像素值wk,2(i,j)的计算公式如下:
其中,Mk,2[i]、Mk,2[j]表示数据矩阵Mk,2中第i行、第j行向量;
第三通道注意力层用于采用行向softmax根据输入的数据矩阵Mk,1和数据矩阵Mk,2计算得到大小为Ck×Ck的通道注意力图Wk,3,然后发送给第一通道注意力图融合层,通道注意力图Wk,3中每个像素值wk,3(i,j)的计算公式如下:
第四通道注意力层用于采用行向softmax根据输入的数据矩阵Mk,1和数据矩阵Mk,2计算得到大小为Ck×Ck的通道注意力图Wk,4,然后发送给第二通道注意力图融合层,通道注意力图Wk,4中每个像素值wk,4(i,j)的计算公式如下:
第一通道注意力图融合层用于对通道注意力图Wk,1和通道注意力图Wk,3进行加权融合,得到大小为Ck×Ck的融合通道注意力图W′k,1,然后发送给第一图像增强层,融合通道注意力图W′k,1的计算公式如下:
W′k,1=λkWk,1+(1-λk)Wk,3
其中,λk表示权重参数;
第一图像增强层用于对接收到的大小为Ck×Nk的输入图像数据矩阵F″k和大小为Ck×Ck的融合通道注意力图W′k,1进行矩阵乘法,得到大小为Ck×Nk增强的图像数据矩阵G′k,1=W′k,1·F″k,然后输入至第三维度变换层;
第三维度变换层将大小为Ck×Nk增强的图像数据矩阵G′k,1转换为大小为Ck×Hk×Wk的特征图Gk,1,然后发送给对应尺度的检测头部模块;
第二通道注意力图融合层用于对通道注意力图Wk,2和通道注意力图Wk,4进行加权融合,得到大小为Ck×Ck的融合通道注意力图W′k,2,然后发送给第二图像增强层,融合通道注意力图W′k,2的计算公式如下:
W′k,2=λkWk,2+(1-λk)Wk,4
第二图像增强层用于对接收到的大小为Ck×Nk的输入图像数据矩阵F″k和大小为Ck×Ck的融合通道注意力图W′k,2进行矩阵乘法,得到大小为Ck×Nk增强的图像数据矩阵G′k,2=W′k,2·F″k,然后输入至第四维度变换层;
第四维度变换层将大小为Ck×Nk增强的图像数据矩阵G′k,2转换为大小为Ck×Hk×Wk的特征图Gk,2,然后发送给对应尺度的尺度感知注意力网络SAAN模块;
检测头部模块用于对接收到的对应尺度的特征图Gk,1进行目标检测,得到该尺度下的目标检测框;
尺度感知注意力网络SAAN模块用于根据接收到的K个特征图Gk,2得到目标的ReID特征向量;尺度感知注意力网络SAAN模块包括K个尺度分支处理模块、通道拼接层、通道注意力模块、拼接特征图处理层和特征向量层,其中:
尺度分支处理模块用于采用空间注意力机制对对应尺度特征图Gk,2进行处理,得到特征图Qk,2;尺度分支处理模块包括尺度变换层、卷积层、空间注意力模块、掩膜层,其中尺度变换层用于将大小为Ck×Hk×Wk的特征图Gk,2变换至最大尺度,得到大小为的特征图G″k,2,然后发送给卷积层和掩膜层;
卷积层用于对特征图G″k,2进行卷积操作得到大小为的特征图Pk,2,然后发送给空间注意力模块和掩膜层;
空间注意力模块用于对特征图Pk,2生成空间注意力的掩膜图maskk,2,然后发送给掩膜层;
掩膜层用于采用空间注意力的掩膜图maskk,2对特征图Pk,2进行掩膜处理得到特征图Qk,2,然后发送给通道拼接层;
通道拼接层用于将每个尺度分支处理模块得到的特征图Qk,2拼接为大小为的拼接特征图Q2,然后发送给通道注意力模块和拼接特征图处理层;
通道注意力模块用于根据拼接特征图Q2生成维度为的通道注意力向量,发送给拼接特征图处理层;
拼接特征图处理层用于计算拼接特征图Q2中每个像素点的通道向量与通道注意力向量进行对应元素相乘,然后将所得到的特征图与拼接特征图Q2相加,得到特征图Q′2,然后发送给特征向量层;
特征向量层用于对特征图Q′2进行卷积操作得到大小为的特征图I,目标的ReID特征即为特征图I中目标像素点的通道向量;
S2:根据需要设置训练样本集,对步骤S1构建的跟踪一体化模型进行训练;
S3:对于需要进行多目标跟踪的视频序列中的每一帧图像,均采用检测跟踪一体化模型获取当前帧的目标检测结果和ReID特征,采用预设的跟踪机制基于目标检测结果和ReID特征获取各个目标的跟踪结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011347428.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





