[发明专利]一种基于SSA锐化注意机制的目标检测方法有效
| 申请号: | 202110591589.7 | 申请日: | 2021-05-28 |
| 公开(公告)号: | CN113392728B | 公开(公告)日: | 2022-06-10 |
| 发明(设计)人: | 薛梦凡;陈明皓;彭冬亮;杨岗;贾士绅;陈怡达 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06N3/04;G06N3/08;G06T5/00 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 ssa 锐化 注意 机制 目标 检测 方法 | ||
本发明公开了一种基于SSA锐化注意机制的目标检测方法,首次在空间注意力模块中引入了自定义锐化滤波,并和通道注意模块结合使用,减少干扰因素对SSA锐化效果的影响,服务其锐化效果;本发明从空间上加强神经网络中被检测物体的边缘信息,加强物体定位。对于大型物体可以完善其边缘信息,对于中小型物体可以提升其在输出层的存在感,提升检测效果;本发明完善了SSA空间锐化模块和通道注意力模块的结合方式和嵌入位置。对比CBAM中的空间注意力模块,在轻量级目标检测模型上的效果更好。本次发明的SSA空间锐化模块所需的计算量和参数量极少,几乎不影响检测速度,轻量化模块的实用性高,即插即用,易于实现。
技术领域
本发明属于计算机视觉技术领域,特别涉及一种基于神经网络和锐化注意机制的轻量化空间注意力模块和其在一阶段轻量级神经网络上与通道注意力模块结合的目标检测方法。
背景技术
文献1(Hu J,Shen L,Sun G.Squeeze-and-excitation networks.In:Proceedings of the IEEE Conference on Computer Vision and PatternRecognition,Salt Lake City, 2018.7132-7141)在网络中间特征图后引入通道注意力支路,通过平均池化操作提取特征图通道信息,得到通道级的全局特征,然后经过含一个隐藏层的FC多层感知器来学习各通道之间的联系,也得到不同通道的权重,再通过Sigmoid函数限制输出的界限后乘以 原来的特征图并得到最终特征。SE模块是一种经典的通道注意力模块,对后续各通道注意力的发展奠定了基石。
文献2(Woo S H,Park J,Lee J Y,et al.CBAM:Convolutional block attentionmodule.In:Proceedings of the 15th European Conference on Computer Vision,Munich, 2018)通过在SE通道注意模块中添加最大池化操作,并串联一种新的空间注意模块来获取并调整目标的空间信息,Woo等人在测试后也在空间模块中使用了最大池化和平均池化合并提取特征图空间信息的方式,并给予一个可训练可调整卷积核大小的卷积层,最后通过 Sigmoid激活函数乘以 原特征图,以达到强调或削弱空间信息的目的。
文献3(Wang Q L,Wu B G,Zhu P F,et al.ECA-Net:Efficient ChannelAttention for Deep Convolutional Neural Networks.In:Proceedings of the IEEEConference on Computer Vision and Pattern Recognition,Seattle,2020)Wang等人认为在SE注意力模块中降维提取通道信息的方法会丢失通道中部分信息,在经过相关实验后证明了这一点,并给出了创新的方案。即通过一维卷积来捕获局部的跨通道交互,并通过k决定了交互的覆盖范围,也是一维卷积的卷积核大小。其结构大致与SE模块一致。在网络中间特征图后引入通道注意力支路,通过平均池化操作提取特征图通道信息,得到通道级的全局特征,然后通过一个一维卷积层来学习各通道之间的联系,为不同的通道分配不同的权重,再通过Sigmoid函数限制输出界限,然后乘以 原特征图得到最终特征。对比SE模块,ECA模块在大幅度降低参数数量同时,保持了通道注意力的高性能。
发明内容
本发明为解决轻量级目标检测模型对中小目标的定位困难问题和对大型目标的边缘丢失问题,提出一种基于SSA锐化注意机制的目标检测方法。
本发明一种基于SSA锐化注意机制的目标检测方法,具体包括以下步骤:
步骤(1):使用目标检测领域常用的VOC2012或COCO2017数据集作为输入图片;使用一阶段轻量级神经网络作为基础检测网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110591589.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种液晶拼接屏玻璃自动打粒装置
- 下一篇:一种基于压力损失控制的涡环激励器





