[发明专利]一种基于特征对齐的图像融合目标检测方法在审
申请号: | 202211722638.7 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116434019A | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 邢佳璐 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06N3/08;G06N3/0464 |
代理公司: | 北京精翰专利代理有限公司 11921 | 代理人: | 张丹 |
地址: | 450001 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 对齐 图像 融合 目标 检测 方法 | ||
本发明公开了一种基于特征对齐的图像融合目标检测方法,包括以下步骤:S1、模态特征偏移预测:网络首先通过特征网络提取两个模态的特征,随后将之进行通道级联并送入特征偏移预测模块来为特征图的每个位置预测x方向y方向的偏移;S2、级联候选框生成:将偏移反馈给偏移模态后得到初步修正的偏移模态特征图,采取由粗到细的特征对齐策略,在仅使用一个模态标注的情况下对两个模态的特征进行空间对齐,并直接使用两个模态的特征进行后续的检测,已有标注的模态,通常为热红外为参考模态,对另一个模态,即偏移模态的特征图进行处理使之在空间位置上靠近参考模态,来达到模态间特征对齐的效果,加快检测速度,同时可以快速回归检测框。
技术领域
本发明涉及图像处理技术领域,具体为一种基于特征对齐的图像融合目标检测方法。
背景技术
RGB-T图像的配准过程较为复杂,在采集数据前首先需要对相机进行标定,需要用到特定的硬件及特殊的标定板,在数据采集的过程中,除了要准备不同的传感器,如可见光相机、热红外相机等,还需要一些特殊的部件,如用于空间对齐的分光镜以及用于时间对齐的同步计时器,近年来,许多学者提出了RGB-T目标检测数据集,使用特别设计的硬件、预处理手段等将不同模态的图像进行了像素级对齐,并提供了模态间共享的标注,目前大多数的先进RGB-T图像目标检测器都在这种模态间对齐的基础上构建,然而现实世界中,像素级对齐的数据仅仅占少数,更多的是存在偏移和未经配准的数据。这是由于复杂的配准流程、传感器的物理特性差异(视差、相机分辨率不一致、视场不匹配等)、对齐算法不完善、外部干扰和硬件老化等导致。
如此的跨模态差异会降低检测器的性能,一方面,不同模态的输入图像在相应的位置不匹配,待融合的特征也存在空间位置的偏移,融合时特征图上的特征含义不明确,给网络推理造成困难,导致产生不稳定的目标分类及定位。另一方面,两个模态共享标注会引入标注偏差,网络不能分辨标注信息到底属于哪一个模态,使得检测框的位置回归变得困难,为此提出一种基于特征对齐的图像融合目标检测方法。
发明内容
本发明的目的在于提供一种基于特征对齐的图像融合目标检测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于特征对齐的图像融合目标检测方法,包括以下步骤:
S1、模态特征偏移预测:网络首先通过特征网络提取两个模态的特征,随后将之进行通道级联并送入特征偏移预测模块来为特征图的每个位置预测x方向y方向的偏移;
S2、级联候选框生成:将偏移反馈给偏移模态后得到初步修正的偏移模态特征图,与初始的参考模态特征图进行级联后送入区域生成网络,得到一系列候选框;
S3、候选框二次回归:感兴趣区域对齐模块对候选框部分偏移的特征进行进一步对齐,通过为每个候选框预测x、y、w、h四个维度的调整参数,对热红外模态的候选框进行二次回归;
S4、特征加权并级联:在进行二次回归后将微调过的偏移模态感兴趣区域池化特征与原本的参考模态感兴趣区域池化特征进行重新加权并级联,送入最后的检测头来得到分类置信度和目标的包围框坐标。
优选的,在特征加权过程中,通过可见光图像中的不同光照值自适应地对两个模态的特征进行加权,使用一个光照感知子网络来对光照值进行预测,光照感知子网络由2个卷积层和3个全连接层组成,每个卷积层后接一个ReLU激活函数层以及一个2×2最大池化层来对特征进行激活和压缩,并在最后一层全连接层之后使用softmax激活函数。
优选的,在特征加权过程中,为了减小计算量,将可见光图像进行8倍下采样后再作为输入,网络会输出2个预测值,分别是图像为白天的概率Cd和图像为夜晚的概率Cn,由于该任务是一个较为简单的二分类任务,因此Cd、Cn会接近0或者1,若将其直接作为各个模态的权重则会对其中一个模态产生抑制效果;
模态权重合理性调整,通过门函数对两个模态的权重进行重新调整:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211722638.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序