[发明专利]基于跨上下文和特征响应注意力机制的车辆重识别方法有效
申请号: | 202310436317.9 | 申请日: | 2023-04-23 |
公开(公告)号: | CN116152792B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 庞希愚;孙珂;郑美凤;李曦;周厚仁;周晓颖;田佳琛;王成;栗世涛 | 申请(专利权)人: | 山东交通学院 |
主分类号: | G06V20/60 | 分类号: | G06V20/60;G06V10/82;G06V10/778;G06V20/70;G06V10/764;G06N3/0464;G06N3/048;G06N3/082 |
代理公司: | 青岛高晓专利事务所(普通合伙) 37104 | 代理人: | 步丽丽 |
地址: | 250000 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 跨上 下文 特征 响应 注意力 机制 车辆 识别 方法 | ||
本发明涉及车辆重识别技术领域,具体地涉及一种基于跨上下文和特征响应注意力机制的车辆重识别方法,首先提出了局部混合跨上下文‑特征响应的注意力机制,并设计了基于该注意力机制的通道注意力模块和空间注意力模块,运用高效的方式将全局信息和局部信息集成到一个统一的体系结构中来提高注意力学习的效率及性能。然后在通道以及空间注意力模块中分别使用了通道分组缩减和空间分辨率缩减的方法使其减少网络的参数量和计算负担;最后通过设计去相似性约束,强制多分支上的空间注意力模块关注不同的语义信息,实现车辆重识别。本发明在车辆重识别任务中取得了先进的性能,提高了车辆重识别网络的识别精度及工作效率。
技术领域
本发明涉及车辆重识别技术领域,具体地涉及一种基于跨上下文和特征响应注意力机制的车辆重识别方法。
背景技术
随着深度学习的发展以及大型数据集的提出,基于卷积神经网络(CNNs)的车辆重识别方法凭借其丰富的表示能力显著地提升了视觉任务的性能。然而,不同实例之间的相似性是车辆重识别任务中存在的不容忽视的难题之一。一个有效的解决方案是既要建立长距离依赖还要关注信息丰富的车辆部件,例如,挂饰、摆件、制造商标志等,也就是在进行车辆重识别任务时不仅要从图像的整体中捕获全局特征,还要进行局部的鉴别性信息提取。
现如今,注意力机制被广泛应用于各种计算机视觉领域,如图像分类、物体检测、语义分割、行人重识别等,它是一种基于输入图像特征的动态权重调整过程,即资源的分配偏向于有用信息量较大的部分来帮助网络关注有意义的特征并抑制不必要的特征。在深度学习任务中正确联合注意力模块是显著提高卷积神经网络学习能力的有效手段之一。
现有技术中,将图像划分为一系列不重叠的patch,利用多头自注意力层学习全局表示并将其与全连接层、归一化层和GELU激活函数结合进行特征提取来完成图像识别,但其自注意力机制使用全局感受野捕获全局信息,在单个样本中聚合所有其他位置的特征来优化每个位置的表示,这导致了计算成本将与每张图像的像素数量成平方比例,网络的复杂度大幅度增加,影响图像识别精度和工作效率。
发明内容
本发明的目的在于克服现有技术存在的缺点,提出设计一种基于跨上下文和特征响应注意力机制的车辆重识别方法,以提高车辆重识别网络的识别精度及工作效率。
本发明解决其技术问题所采取的技术方案是:
一种基于跨上下文和特征响应注意力机制的车辆重识别方法,包括:
步骤1、将车辆图像作为输入,采用Resnet50作为骨干网络,res_conv4_1之后的部分被划分为三个独立的分支;三个独立的分支分别是:一个全局分支Global Branch、两个局部分支Part_1 Branch和Part_2 Branch;
步骤2、在Global Branch分支的res_conv5层后添加通道注意力模块,通道注意力模块分别基于通道间的成对关系以及两种不同的压缩方式构建上下文信息和特征响应;再使用1D卷积对区域内的上下文和特征响应进行混合,从而以一种高效的方式同时编码全局信息和局部信息,获取通道间的长距离依赖和鉴别性特征;
步骤3、对于Part_1 Branch和Part_2 Branch,res_conv5层的输出被输入到空间注意力模块中;空间注意力模块利用位置间的自相关性获取上下文信息,在空间方向上捕获长距离依赖关系,同样以两种不同的挤压方式得到特征响应来确保每个空间位置的自身信息的整合,再以卷积的方式高效混合上下文和特征响应以获取局部关系,实现车辆重识别,使模型更准确地定位和识别感兴趣的目标。
进一步的,针对于两个局部分支,将输出特征图水平划分为两个部分来进一步提取细粒度特征,具体的,包括:
在每个分支上应用全局平均池化(GAP)操作,得到维数为2048的特征向量;
使用包括1*1卷积、BN层(批量归一化层)和ReLU激活函数的一系列操作将维数减少至256;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东交通学院,未经山东交通学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310436317.9/2.html,转载请声明来源钻瓜专利网。