[发明专利]一种复杂场景下的红外目标检测方法在审
| 申请号: | 202210207336.X | 申请日: | 2022-03-04 |
| 公开(公告)号: | CN114898105A | 公开(公告)日: | 2022-08-12 |
| 发明(设计)人: | 马小林;蔡永培;旷海兰;刘新华 | 申请(专利权)人: | 武汉理工大学 |
| 主分类号: | G06V10/42 | 分类号: | G06V10/42;G06V10/44;G06V10/764;G06V10/774;G06V10/80;G06T7/11;G06T3/40;G06T3/00;G06N3/04;G06V10/82 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
| 地址: | 430070 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 复杂 场景 红外 目标 检测 方法 | ||
1.一种复杂场景下的红外目标检测方法,其特征在于,包括如下步骤:
(1)对输入红外图像进行Mosaic数据增强;
(2)对特征提取网络CSPDarknet53结构进行优化改进,在特征提取网络中加入注意力机制ECA模块;使用Focus结构对输入图像进行切片操作,再经过多次卷积处理,然后利用优化的CSPDarknet53特征提取网络进行特征信息的提取,得到不同尺度的特征图,并在特征提取网络后加入SPP模块,解决目标尺度变化带来的精度下降的问题;
(3)将(2)中最后所得的最小特征图通过特征金字塔网络结构与路径聚集网络结构,将高层的强语义特征信息与低层的强定位特征进行融合,结合两种网络结构最终得到同时具备强语义特征和强定位特征的不同尺度的检测层;
(4)优化损失函数,使用Varifocal Loss作为检测物体的置信度和类别概率的损失函数,实现多尺度检测,得到不同的预测框;
(5)对(4)所得预测框进行非极大值抑制处理,通过基于DIoU的非极大值抑制对预测框进行筛选,消除置信度低的预测框,得到精确度更高的预测框;
(6)使用FLIR红外图像数据集对(2)-(5)中的整体网络结构进行训练,使用训练得到的整体网络结构进行检测,得到测试结果。
2.如权利要求1所述的一种复杂场景下的红外目标检测方法,其特征在于:步骤(1)的具体实现方式如下;
(1-1)对输入红外图像预处理,对图像进行自适应缩放,统一缩放为640×640的尺寸;
(1-2)对缩放后的图像进行数据增强,每4张图片通过随机缩放、裁剪、排布的方式进行拼接,丰富检测数据集,提升小目标的检测效果。
3.如权利要求1所述的一种复杂场景下的红外目标检测方法,其特征在于:步骤(2)的具体实现方式如下;
(2-1)对主干特征提取网络CSPDarknet53结构进行改进,在卷积层之间添加注意力机制ECA模块,将特征提取网络中的10层网络变为13层网络;
(2-2)使用Focus结构将步骤(1)所得图像进行切片操作把高分辨率的特征图拆分为多个低分辨率的特征图,在通道维度上进行拼接再经过一次卷积得到320×320的特征图,然后经过步长为2的3×3卷积核对得到的320×320特征图进行4次下采样,并使用优化后的CSPDarknet53网络结构进行特征提取分别得到160×160、80×80、40×40、20×20的特征图;
(2-3)在特征提取网络后加入SPP模块,首先对改进的CSPDarknet53网络进行特征提取所得到的20×20特征图经过1×1的卷积核进行降维,然后经过四种不同大小的池化层得到全局特征和局部特征,具体地,经过1×1大小的池化层获取全局特征,经过5×5、9×9、13×13大小的池化层获取不同大小的特征图得到局部特征,经过不同的通道获取不同的特征信息,然后将局部特征与全局特征进行融合,再经过一次卷积得到新的20×20特征图,增强特征表达能力,扩大特征图的感受野,解决目标尺度变化带来的精度下降的问题。
4.如权利要求3所述的一种复杂场景下的红外目标检测方法,其特征在于:步骤(3)的具体实现方式如下;
将步骤(2-3)中所得20×20特征图通过特征金字塔自顶向下将高层的特征信息通过上采样的方式进行传递融合,将20×20特征图进行上采样得到40×40特征图,再与(2-2)中特征提取网络所得40×40特征图进行融合,将融合所得40×40特征图进行上采样得到80×80特征图,与(2)中特征提取网络所得80×80特征图进行融合得到融合的80×80特征图,然后通过路径聚集网络将融合所得80×80特征图进行下采样得到40×40特征图,并与特征金字塔中经过融合所得到的40×40特征图进行融合,再将融合所得40×40特征图进行下采样得到的20×20特征图与(2-3)中经过SPP模块处理所得20×20特征图进行融合得到融合的20×20特征图;通过两种网络结构结合,最终得到同时具备强语义特征和强定位特征的20×20、40×40、80×80三个不同尺度的检测层,实现不同大小目标类别和位置的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210207336.X/1.html,转载请声明来源钻瓜专利网。





