[发明专利]一种基于注意力机制和对比学习损失函数的目标检测方法在审

专利信息
申请号: 202211053660.7 申请日: 2022-08-31
公开(公告)号: CN115424004A 公开(公告)日: 2022-12-02
发明(设计)人: 代龙泉;高迪;唐金辉 申请(专利权)人: 南京理工大学
主分类号: G06V10/24 分类号: G06V10/24;G06V10/774;G06V10/82;G06V10/764;G06V10/766;G06V10/80;G06N3/04;G06N3/08
代理公司: 南京理工大学专利中心 32203 代理人: 朱沉雁
地址: 210094 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 注意力 机制 对比 学习 损失 函数 目标 检测 方法
【说明书】:

发明公开了一种基于注意力机制和对比学习损失函数的目标检测方法,步骤如下:使用四折旋转构建对比数据集;使用空间注意力层、通道注意力层、上采样层、下采样层等构建单阶段目标检测网络,使用三种编码器加速训练;将旋转图像输入同步网络,并使用EMA更新网络参数;计算有监督类别对比损失、无监督特征点对比损失,以及检测任务常规的分类损失和回归损失;使用先验Anchor加速训练,使用NMS获得推理结果。旨在同时增强网络对目标的分类能力以及对目标位置的回归能力,解决单阶段目标检测算法在图像特征的处理中无法同时保证特征的不变性和等变性而导致目标检测精度无法进一步提升的问题,解决基于Transformer的目标检测网络收敛速度较慢的问题。

技术领域

本发明属于人工智能、计算机视觉领域,具体涉及一种基于注意力和对比学习的目标检测方法。

背景技术

目标检测是一种可以输出图片中若干个目标的类别和位置的算法,与图片分类算法不同,它不仅仅涉及分类任何,还涉及回归任务。随着深度学习的不断发展,基于神经网络的检测算法的准确率要远超基于人为提取特征的传统检测算法,且神经网络的泛化能力更强。众多基于深度学习的目标检测算法可以被分类两大类,分别是单阶段目标检测算法和两阶段目标检测算法,两者的区别在于是否需要预先生成候选框。单阶段目标检测算法因无需事先生成候选框、网络架构更加精简、训练过程更加简便、推理速度更快而被广泛运用。

注意力机制首先运用于自然语言处理领域,但由于其效果出类拔萃,很快便应用于计算机视觉领域,例如基于多头注意力网络的DETR,它将注意力机制引入目标检测任务中,而且利用匈牙利算法进行端到端的训练和推理,研究价值,因此研究者提出了很多关于DETR的变体,比如引入条件空间查询的Conditional DETR加快网络收敛速度、加入无监督对比学习的UP-DETR提高了目标检测精度,使用关注稀疏空间定位的方式的DeformableDETR在保证精度的同时极大地降低网络收敛所需要的时间。本发明在网络设计上,通过在恰当的网络层中使用空间和通道注意力机制,设计三种编码器,使得网络最终输出基于不同种类Anchor的类别和位置预测结果,相较于DETR,本网络将解码器替换为同等规模的编码器,而且这种编码器可以加强分类分支与定位分支的关系,让这两种不同类型的任务能在预测结果上更加统一,在保证精度的同时可以做到更快地收敛。

在互联网环境中,存在海量的数据,但这些数据无法直接用于训练网络模型,因为缺少对应的标签,若要获取数据标签往往需要通过人为标注,而这所带来的时间和资金成本都是极高的,为了打破这一窘境,对比学习运用而生,它被广泛应用于无监督训练领域,无需标签,只需在数据间进行对比,就可以训练网络,只需在少量的包含标签的数据集上进行微调,便可以取得不错的效果。

由于对比学习主要运用在图像分类的预训练任务中,而目标检测任务却很少使用对比学习,但是相同类别的目标之间是具有对比性的,而在现有研究中,这一点往往被忽略,这就会导致网络的分类能力和回归能力无法同时提升,这对整个目标检测任务来说是不利的,而本发明通过四种旋转增强图片之间的对比,来改变这一不利因素,具体来说,本发明在训练流程上采用对比的形式,通过四种旋转增强图片,挖掘目标检测中可以进行对比的部分,加入分类对比损失与回归对比损失,使得分类分支表现出旋转不变性,同时让定位分支表现出旋转等变性,通过异化两个分支上的特性,让网络更加符合目标检测任务,从而提升检测精度。

发明内容

本发明的目的在于提供一种基于注意力机制和对比学习损失函数的目标检测方法,旨在同时增强网络对目标的分类能力以及对目标位置的回归能力,解决单阶段目标检测算法在图像特征的处理中无法同时保证特征的不变性和等变性而导致目标检测精度无法进一步提升的问题。

本发明采用的技术方案是:一种基于注意力机制和对比学习损失函数的目标检测方法,包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211053660.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top