[发明专利]一种基于注意力机制的改进YOLOv3目标检测方法在审
| 申请号: | 202011396416.1 | 申请日: | 2020-12-04 |
| 公开(公告)号: | CN112508014A | 公开(公告)日: | 2021-03-16 |
| 发明(设计)人: | 李永胜;孙长银;陆科林;徐乐玏 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04 |
| 代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
| 地址: | 210096 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 机制 改进 yolov3 目标 检测 方法 | ||
1.一种基于注意力机制的改进YOLOv3目标检测方法,其特征在于,包括如下步骤:
S1:针对一张原始图像,对其进行预处理,并归一化为416×416×3,得到训练样本;
S2:修改Darknet-53的网络结构,在每个残差层Basic Block模块中均引入自适应卷积核大小的注意力机制;
S3:在Darknet-53顶部引入空间金字塔池化模块SPP,以增加特征提取网络的感受野;
S4:用改进后的Darknet-53网络提取图像特征,并从网络的不同深度引出三个尺度的特征图(feature map)至特征融合支路;
S5:在三条特征融合支路中引入通道注意力机制,为通道分配权重,充分提取通道的有效特征信息;
S6:最后在三条支路上分别预测,得到多尺度目标检测结果。
2.根据权利要求1所述的一种基于注意力机制的改进YOLOv3目标检测方法,其特征在于,所述步骤S1中,预处理方式包括随机旋转、水平翻转和标准化处理。
3.根据权利要求1所述的一种基于注意力机制的改进YOLOv3目标检测方法,其特征在于,所述步骤S2中,在残差层Basic Block模块中引入自适应卷积核大小的注意力机制的方法为:
S21:在第一个卷积核大小为1×1的卷积层后插入自适应卷积核大小的卷积模块Selective Kernel Networks(SKNet);
S22:将原先第二个卷积层的卷积核大小由3×3修改为1×1。
4.根据权利要求1所述的一种基于注意力机制的改进YOLOv3目标检测方法,其特征在于,所述步骤S3中,在Darknet-53顶部引入空间金字塔池化模块SPP的方法为:
S31:从Darknet-53最后一个基本卷积模块的输出引出4条支路;
S32:第一、第二、第三条支路分别通过最大池化层a1、a2、a3,a1的核大小为5,步长为1,a2的核大小为9,步长为1,a3的核大小为13,步长为1,最后一条支路保留原输出特征;
S33:将4条支路的输出在通道维度上进行拼接,得到一个新的特征图(feature map);
S34:将新得到的特征图最后通过一个卷积层,得到原特征的通道数。
5.根据权利要求1所述的一种基于注意力机制的改进YOLOv3目标检测方法,其特征在于,所述步骤S5中,在特征融合支路中引入通道注意力机制的方法为:
选择8倍降采样和16倍降采样两条支路,在上采样层Upsample和这两条支路输出的特征图按通道维度拼接融合后,插入一个通道注意力机制模块Squeeze-and-ExcitationNetworks(SENet)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011396416.1/1.html,转载请声明来源钻瓜专利网。





