[发明专利]一种复杂场景下的SAR图像目标检测方法在审
申请号: | 202110662120.8 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113536929A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 陶诗飞;李男;王昊;叶晓东;黄鑫宇;陈玲;许梦南;李莉 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 薛云燕 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 场景 sar 图像 目标 检测 方法 | ||
1.一种复杂场景下的SAR图像目标检测方法,其特征在于,包括以下步骤:
步骤1、利用YOLOv5网络模型对SAR图像进行特征训练,得到不同场景下目标的初始特征;
步骤2、利用由空间注意力和通道注意力组成的混合注意力模块加强初始特征,得到具有筛选加权特性的特征图,即加强后的特征图;
步骤3、在加强后的特征图上预测目标位置,优化训练损失函数,并使用优化后的损失函数反向更新模型参数。
2.如权利要求1所述的复杂场景下的SAR图像目标检测方法,其特征在于,步骤1所述的利用YOLOv5网络模型对SAR图像进行特征训练,具体包括如下步骤:
步骤1.1、首先将图像按随机缩放、随机裁剪和随机排布的方式进行拼接,增加数据集维度,以此扩大网络的特征学习范围;
步骤1.2、然后将增强后的数据送入YOLOv5网络中进行特征提取和特征融合。
3.根据权利要求1所述的复杂场景下的SAR图像目标检测方法,其特征在于,步骤2所述的利用由空间注意力和通道注意力组成的混合注意力模块加强初始特征,得到具有筛选加权特性的特征图,即加强后的特征图,具体如下:
步骤2.1、计算通道注意力权值W1∈R1×1×C,R表示矩阵,设F(i,j,z)∈RH×W×C为输入混合注意力模块的特征图,其中H、W、C分别为输入特征图的长度、宽度和通道数,i∈[1,H],j∈[1,W],z∈[1,C];
通道注意力模块中,首先将输入特征在空间维度上分别通过均值池化层和最大值池化层压缩降维;然后将压缩后的特征图分别送入感知机层;最后把两个特征图结果叠加后送入激活函数,得到通道注意力权重W1∈R1×1×C,如式(1):
式中σ为Sigmoid函数,fMLP是由前后两层全连接层和中间一层ReLU函数组成的感知机;为对应元素相加,ATavg,ATmax分别为均值池化层和最大值池化层,如式(2)和(3):
通道注意力模块输出特征图为FC∈RH×W×C,如式(7),
FC=W1×F(i,j) (4)
步骤2.2、计算空间注意力权值W2∈RH×W×1,首先将输入特征图在通道域上分别通过均值池化层和最大值池化层压缩降维,然后将压缩后的特征图在通道域拼接,最后经组成的卷积层调整通道深度后送入激活函数,得到空间注意力权重W2∈RH×W×1,如式(8):
其中表示7×7大小的卷积核;
步骤2.3、综合通道注意力权值和空间注意力权值,得到加强后的特征图如式Fe(6)
Fe=W1×W2×F(i,j,z) (6)。
4.根据权利要求3所述的复杂场景下的SAR图像目标检测方法,其特征在于,步骤3所述的优化训练损失函数,具体如下:
利用Varifocal Loss函数提升预测框的置信度,训练损失函数Loss如式(7):
其中P是网络输出预测框的置信度,q是目标IoU分数;
对于训练中得分高于阈值的正样本,模型加大其所占的损失权重;
对于训练中的负样本q均为0;
负样本损失中加入γ降权,并针对负样本损失使用α进行降权。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110662120.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序