[发明专利]一种基于维度解耦和非局部关系的车辆重识别方法有效
申请号: | 202210531995.9 | 申请日: | 2022-05-17 |
公开(公告)号: | CN114663861B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 王成;孟庆兰;田鑫;郑艳丽;姜刚武;庞希愚;栗士涛;李曦;周厚仁;郑美凤;孙珂 | 申请(专利权)人: | 山东交通学院 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06N3/04;G06N3/08 |
代理公司: | 青岛高晓专利事务所(普通合伙) 37104 | 代理人: | 刘彬 |
地址: | 250000*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 维度 局部 关系 车辆 识别 方法 | ||
1.一种基于维度解耦和非局部关系的车辆重识别方法,其特征在于:包括以下步骤:使用卷积神经网络Resnet50为骨干,将ResNet-50后部分残差层复制为三个相同结构的分支,三个分支在残差层后分别引入全局特征提取机制、非局部关系捕获机制和维度解耦机制;
所述全局特征提取机制用于提取车辆的全局特征,将res_conv5层生成的特征图依次输入到全局平均池化和一个由1×1卷积、批量标准化和ReLU激活函数组成的通道降维模块,得到256维的特征表示;
所述非局部关系捕获机制包括基于通道的非局部关系捕获模块和基于空间的非局部关系捕获模块,两者分别针对通道与空间层面的非局部关系进行降噪,同时也在通道与空间层面为通道间和位置间的关系分配不同的权重;该机制旨在挖掘出有用的非局部关系进而提升网络的性能;
所述维度解耦机制用于剥离通道与空间之间信息的互相干扰,解耦空间与通道,从而使一部分特征专注于特定的一个子空间;
所述基于空间的非局部关系捕获模块的组成结构:设X∈RC×H×W为特征提取模块的输入,其中W和H分别是输入张量的宽度和高度,C为通道数量;其中函数f(x)为对输入x进行r个深度可分离卷积运算,卷积核大小为H×W,则得到了r个大小为C×1×1的输出特征,随后将它们都变形为C×1,然后在空间维度进行拼接得到C×r的矩阵,记该矩阵为A;g(x)为对输入张量x做1×1卷积操作,并经过变形操作得到HW×C的矩阵B,然后将A与B矩阵相乘来确定非局部关系并得到大小为HW×r的矩阵;在得出的非局部关系的基础之上对每一列使用softmax激活函数来得到合适的概率矩阵xp:
xp=softmax(f(x)×g(x));
xp的尺寸为HW×r,然后求概率矩阵的每一行之和得到权重向量Q,该向量的每个元素Qi代表了第i个空间位置的权重;Qi表达为:
基于空间的非局部关系捕获模块最终的输出特征Sf为:
Sf=Q*x+x;
在该特征提取模块中,f(x)函数为r个卷积核大小为H×W的深度可分离卷积;
所述基于通道的非局部关系捕获模块的组成结构:首先将原始特征X∈RC×H×W输入到两个1×1卷积操作;第一个1×1卷积用于将通道从C压缩到C/g,其中g为超参数,然后将它变形为J,尺寸为HW×C/g;第二个1×1卷积操作之后变形为K,尺寸为HW×C,将K的转置与J进行矩阵相乘得到大小为C×(C/g)的全局参考,记为xg;将xg的每一列使用softmax激活函数来得到概率矩阵;然后求概率矩阵的每一行之和,此操作用函数α(x)表示,得到尺寸为C的基于通道的全局特征掩码M,
M=α(softmax(KT×J));
然后将M与输入特征x进行元素点乘之后再与x相加得到最终的输出特征表示;基于通道的非局部关系捕获模块最终的输出特征Sf为:
Sf=M*x+x。
2.根据权利要求1所述的基于维度解耦和非局部关系的车辆重识别方法,其特征在于:所述非局部关系捕获机制具体操作为:将res_conv5层输出的张量同时输入到基于空间的非局部关系捕获模块和基于通道的非局部关系捕获模块中;经过空间和通道非局部关系捕获模块的特征尺寸不变,然后经过全局平均池化、1×1卷积、批量标准化和ReLU操作,将维度由2048降低至256。
3.根据权利要求1所述的基于维度解耦和非局部关系的车辆重识别方法,其特征在于:所述维度解耦机制具体操作为:先在空间维度将特征图从水平方向上分割成两部分得到两个特征图,然后将得到的两个特征图在通道维度上都均分为两部分;解耦操作后在两个子空间独立执行特征提取操作:将特征图经过全局平均池化、1×1卷积、批量标准化和ReLU操作,将维度由2048降低至256。
4.根据权利要求1-3任一项所述的基于维度解耦和非局部关系的车辆重识别方法,其特征在于:采用交叉熵损失函数和三元组损失函数对网络进行约束:
使用ResNet-50作为骨干网络,设置批处理大小为16,训练轮数为450轮,图像在输入网络之前调整大小为256×256;在训练阶段,利用三元组损失训练约束降维后的256维特征;另外,将降维后的特征经过一个全连接层使256维特征变为数据集的车辆ID数量,然后用交叉熵损失进行训练约束;在测试阶段,利用欧氏距离对车辆图像进行相似度度量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东交通学院,未经山东交通学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210531995.9/1.html,转载请声明来源钻瓜专利网。