[发明专利]基于注意力机制深度学习网络的目标检测方法及装置有效
申请号: | 201911100964.2 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110852383B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 苗书宇;李华宇;刘天弼;冯瑞 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 卢泓宇 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 深度 学习 网络 目标 检测 方法 装置 | ||
1.一种基于注意力机制卷积神经网络模型的目标检测方法,其特征在于,通过含有注意力机制模块的目标检测模型对待检测图像进行特征图提取并从中检测出目标的位置和类别,所述注意力机制模块包括:
至少一个注意力模块M1,用于根据所述特征图生成相同大小注意力权重矩阵并作用于该特征图;
至少一个注意力感受野模块M2,用于对所述特征图进行特征提取;以及
至少一个注意力特征融合模块M3,用于对网络不同层次的特征进行融合,
其中,所述注意力模块M1由shortcut支路、multi-branch支路,合并层构成,
所述shortcut支路用于将所述注意力模块M1的输入直接作为输出F或是将所述注意力模块M1的输入进行两层卷积处理为输出F并输出给所述合并层,
所述multi-branch支路具有两个对称互补相反的分支结构,在所述分支结构对所述注意力模块M1的输入进行处理后,所述multi-branch支路还对两个所述分支结构的输出进行合并操作、使用卷积进行平滑操作、最后通过softmax得到输出W,
所述合并层用于将所述输出F以及所述输出W合并后输出,
所述注意力感受野模块M2包含基础部分以及卷积部分,
所述基础部分用于对所述注意力感受野模块M2的输入通过多分支进行处理,
所述卷积部分用于对所述基础部分的输出通过连接操作层、卷积操作层以及所述注意力模块M1进行处理,
所述注意力特征融合模块M3通过下采样操作、特征融合操作、所述注意力模块M1以及融合之后的平滑卷积操作对输入进行处理。
2.根据权利要求1所述的基于注意力机制卷积神经网络模型的目标检测方法,其特征在于:
其中,所述分支结构中含有至少两个卷积层,且每一个所述卷积层均跟随着激活函数与归一化处理,
所述分支结构最终输出的特征图大小不变且与原输入的特征图大小一致。
3.根据权利要求2所述的基于注意力机制卷积神经网络模型的目标检测方法,其特征在于:
其中,所述卷积层使用不同的激活函数以及不同的归一化方法进行处理。
4.根据权利要求1所述的基于注意力机制卷积神经网络模型的目标检测方法,其特征在于:
其中,所述multi-branch支路进行的所述合并操作包含连接操作或者相加操作。
5.根据权利要求1所述的基于注意力机制卷积神经网络模型的目标检测方法,其特征在于:
其中,所述使用卷积进行平滑操作包含至少一个卷积层进行的平滑操作。
6.根据权利要求1所述的基于注意力机制卷积神经网络模型的目标检测方法,其特征在于:
其中,所述合并层将所述输出F以及所述输出W合并所使用的公式为F+aW,式中,a为固定的权值或是可训练的参数。
7.根据权利要求1所述的基于注意力机制卷积神经网络模型的目标检测方法,其特征在于:
其中,所述注意力感受野模块M2中的所述注意力模块M1被插入在所述连接操作之前、所述连接操作与所述卷积操作之间或所述卷积操作之后,
所述注意力特征融合模块M3中的所述注意力模块M1被设置在上采样操作之后或者所述特征融合操作之后。
8.根据权利要求7所述的基于注意力机制卷积神经网络模型的目标检测方法,其特征在于:
其中,所述上采样的方法包括线性插值、反卷积或SP卷积。
9.根据权利要求1所述的基于注意力机制卷积神经网络模型的目标检测方法,其特征在于:
其中,融合之后的平滑卷积操作可以包括不同类型的平滑操作。
10.一种基于注意力机制卷积神经网络模型的目标检测装置,其特征在于,用于对待检测图像进行特征图提取并从中检测出目标的位置和类别,包括:
预处理部,用于对所述待检测图像进行预处理从而得到预处理图像;以及
目标检测部,用于对所述预处理图像进行目标检测从而检测出目标的位置和类别,存储有一个含有注意力机制模块的目标检测模型,
其中,所述注意力机制模块为权利要求1至9中任意一项所述的注意力机制模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911100964.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于贝叶斯定理的黑臭水体遥感识别方法
- 下一篇:组合电容器