[发明专利]一种复杂场景下的红外目标检测方法在审
| 申请号: | 202210207336.X | 申请日: | 2022-03-04 |
| 公开(公告)号: | CN114898105A | 公开(公告)日: | 2022-08-12 |
| 发明(设计)人: | 马小林;蔡永培;旷海兰;刘新华 | 申请(专利权)人: | 武汉理工大学 |
| 主分类号: | G06V10/42 | 分类号: | G06V10/42;G06V10/44;G06V10/764;G06V10/774;G06V10/80;G06T7/11;G06T3/40;G06T3/00;G06N3/04;G06V10/82 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
| 地址: | 430070 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 复杂 场景 红外 目标 检测 方法 | ||
本发明提供了一种复杂场景下的红外目标检测方法,本发明通过改进的主干特征提取网络对输入红外图像进行特征提取,结合特征金字塔网络结构与路径聚集网络结构,实现不同尺度特征信息的融合,同时优化网络的损失函数,最后对不同尺度的特征图进行预测,并使用基于Distance‑IoU(DIoU)的非极大值抑制提升对密集遮挡物体的检测,可广泛应用于自动驾驶、夜间安防等领域。
技术领域
本发明属于数字红外目标检测领域,具体涉及一种复杂场景下的红外目标检测方法。
背景技术
目标检测是一项重要的计算机视觉任务,包括识别(例如目标分类)和定位(例如位置回归)任务。目标检测需要将特定目标类的目标与图像中的背景进行区分,并对每个目标实例进行精确定位和正确的分类标签预测。目标检测能够为图像和视频的语义理解提供有价值的信息。近年来,随着深度学习技术的快速发展,为目标检测注入了新鲜血液,取得了显著的突破,也将其推向了一个前所未有的研究热点。相对于传统的目标检测方法,深度学习的算法具有更高的精度。
为了实现鲁棒的检测和识别,用于验证的提取特征必须不受光照、姿态和其他变化的影响。可见光图像分辨率高、细节丰富,但是相比红外图像很容易受光照变化的影响,很大程度上增加了目标识别的难度。红外目标检测利用红外探测器感知目标与背景之间的红外辐射差异成像后进行检测。在一些特殊天气如雨天、雾天包括夜间和缺乏光源的情况下,红外成像也可以正常工作,且抗干扰能力强、工作距离远、受天气影响小、能昼夜工作。红外目标检测不仅应用于军事领域,在工业、安防、交通等民用领域也有着广泛应用。
目前基于深度学习的目标检测算法研究已经取得了显著性的成果,但是当下国内外研究的大多数应用场景均是基于可见光条件,有关红外场景的研究很少,因此需要针对红外目标检测进行深入研究。
发明内容
针对现有红外目标检测技术研究较少,且在人群密集、复杂场景下检测效果不佳等问题,本发明提出了一种复杂场景下的红外目标检测方法。其目的在于,使用改进的主干网络进行特征提取,提高模型对重要特征的提取能力。优化网络的损失函数,使得训练聚焦在高质量的正样本上,提高模型在复杂场景下的检测能力,增强鲁棒性。采用多尺度融合实现不同大小目标的检测,增强模型在不同尺度目标下的检测精度。
为了实现上述目的,本发明所采用的技术方案为:一种复杂场景下的红外目标检测方法,该方法包括如下步骤:
(1)对输入红外图像进行Mosaic数据增强;
(2)对特征提取网络CSPDarknet53结构进行优化改进,在特征提取网络中加入注意力机制ECA模块;使用Focus结构对输入图像进行切片操作,再经过多次卷积处理,然后利用优化的CSPDarknet53特征提取网络进行特征信息的提取,得到不同尺度的特征图,并在特征提取网络后加入SPP模块,解决目标尺度变化带来的精度下降的问题;
(3)将(2)中最后所得的最小特征图通过特征金字塔网络结构与路径聚集网络结构,将高层的强语义特征信息与低层的强定位特征进行融合,结合两种网络结构最终得到同时具备强语义特征和强定位特征的不同尺度的检测层;
(4)优化损失函数,使用Varifocal Loss作为检测物体的置信度和类别概率的损失函数,实现多尺度检测,得到不同的预测框;
(5)对(4)所得预测框进行非极大值抑制处理,通过基于DIoU的非极大值抑制对预测框进行筛选,消除置信度低的预测框,得到精确度更高的预测框;
(6)使用FLIR红外图像数据集对(2)-(5)中的整体网络结构进行训练,使用训练得到的整体网络结构进行检测,得到测试结果。
进一步的,步骤(1)的具体实现方式如下;
(1-1)对输入红外图像预处理,对图像进行自适应缩放,统一缩放为640×640的尺寸;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210207336.X/2.html,转载请声明来源钻瓜专利网。





