[发明专利]一种基于注意力机制的改进YOLOv3目标检测方法在审

专利信息
申请号: 202011396416.1 申请日: 2020-12-04
公开(公告)号: CN112508014A 公开(公告)日: 2021-03-16
发明(设计)人: 李永胜;孙长银;陆科林;徐乐玏 申请(专利权)人: 东南大学
主分类号: G06K9/32 分类号: G06K9/32;G06K9/62;G06N3/04
代理公司: 南京众联专利代理有限公司 32206 代理人: 杜静静
地址: 210096 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 注意力 机制 改进 yolov3 目标 检测 方法
【权利要求书】:

1.一种基于注意力机制的改进YOLOv3目标检测方法,其特征在于,包括如下步骤:

S1:针对一张原始图像,对其进行预处理,并归一化为416×416×3,得到训练样本;

S2:修改Darknet-53的网络结构,在每个残差层Basic Block模块中均引入自适应卷积核大小的注意力机制;

S3:在Darknet-53顶部引入空间金字塔池化模块SPP,以增加特征提取网络的感受野;

S4:用改进后的Darknet-53网络提取图像特征,并从网络的不同深度引出三个尺度的特征图(feature map)至特征融合支路;

S5:在三条特征融合支路中引入通道注意力机制,为通道分配权重,充分提取通道的有效特征信息;

S6:最后在三条支路上分别预测,得到多尺度目标检测结果。

2.根据权利要求1所述的一种基于注意力机制的改进YOLOv3目标检测方法,其特征在于,所述步骤S1中,预处理方式包括随机旋转、水平翻转和标准化处理。

3.根据权利要求1所述的一种基于注意力机制的改进YOLOv3目标检测方法,其特征在于,所述步骤S2中,在残差层Basic Block模块中引入自适应卷积核大小的注意力机制的方法为:

S21:在第一个卷积核大小为1×1的卷积层后插入自适应卷积核大小的卷积模块Selective Kernel Networks(SKNet);

S22:将原先第二个卷积层的卷积核大小由3×3修改为1×1。

4.根据权利要求1所述的一种基于注意力机制的改进YOLOv3目标检测方法,其特征在于,所述步骤S3中,在Darknet-53顶部引入空间金字塔池化模块SPP的方法为:

S31:从Darknet-53最后一个基本卷积模块的输出引出4条支路;

S32:第一、第二、第三条支路分别通过最大池化层a1、a2、a3,a1的核大小为5,步长为1,a2的核大小为9,步长为1,a3的核大小为13,步长为1,最后一条支路保留原输出特征;

S33:将4条支路的输出在通道维度上进行拼接,得到一个新的特征图(feature map);

S34:将新得到的特征图最后通过一个卷积层,得到原特征的通道数。

5.根据权利要求1所述的一种基于注意力机制的改进YOLOv3目标检测方法,其特征在于,所述步骤S5中,在特征融合支路中引入通道注意力机制的方法为:

选择8倍降采样和16倍降采样两条支路,在上采样层Upsample和这两条支路输出的特征图按通道维度拼接融合后,插入一个通道注意力机制模块Squeeze-and-ExcitationNetworks(SENet)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011396416.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top