[发明专利]一种基于逐级注意力机制的目标显著性检测方法在审
| 申请号: | 202111536499.4 | 申请日: | 2021-12-15 |
| 公开(公告)号: | CN114241218A | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 颜成钢;王灵波;孙垚棋;张继勇;李宗鹏 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 逐级 注意力 机制 目标 显著 检测 方法 | ||
1.一种基于逐级注意力机制的目标显著性检测方法,其特征在于,包括如下步骤:
步骤1、图像数据预处理,获得预处理后的图像训练集:
训练数据集采用DUTS图像数据集;对待训练数据集进行图像预处理,首先去除图像相关噪声干扰使数据更加精确,然后对去噪后的训练数据集进行扩增,获得预处理后的图像训练集;
步骤2、构建目标显著性检测网络:
目标显著性检测网络采用encoder-decoder结构,编码部分采用ResNet34,在解码部分采用部分解码结构减少网络数据量,并且有两组不同的注意力模块与PDC逐次连接;;
步骤3、通过步骤1获得的图像训练集对目标显著性检测网络进行训练。
2.根据权利要求1所述的一种基于逐级注意力机制的目标显著性检测方法,其特征在于,步骤2所述的目标显著性检测网络具体结构如下:
编码部分包括一个输入卷积层和五个卷积块,五个卷积块均采用ResNet34,第四及第五个卷积块的信息将会分别输入到由两个并行连接的通道注意力模块组成的通道注意力模块组中,从而获得第四卷积块和第五卷积块的通道注意力特征,获得的通道注意力特征先进行元素级求和后,与第四、五卷积块的特征信息一同输入适应其通道数的部分解码器,由此,部分解码器将会输出一个粗略的分割图;
得到粗略的分割图后,为了获得进一步的全局信息,将粗略分割图和第四、第五卷积块通道注意力特征元素级求和的数据一同输入到由三个空间注意力模块逐级连接而成的空间注意力模块组中,每个空间注意力模块连接一个只用于解码的子解码结构,输出批次优化后的分割图作为下一级空间注意力模块的输入;从而进行逐级优化,将最后一级的输出特征与部分解码器输出的粗略的分割图求和后输入残差优化模块得到最终输出结果;
需要注意的是,部分解码器的输出、逐级优化的输出以及最后优化后的输出将使用混合loss函数进行约束。
3.根据权利要求2所述的一种基于逐级注意力机制的目标显著性检测方法,其特征在于,通道注意力模块组中的通道注意力模块结构如下:
给定输入特征F∈RC×H×W,其中C、H、W为通道数、高度、宽度,首先对F通过三次1×1卷积分别获得查询Q,键K,值V,其中{V}∈RC×H×W为像素数。然后,对Q和K进行矩阵乘法,并应用softmax层计算通道注意力图X∈RC×C;
Qi:表示矩阵Q的第i行,Kj:表示矩阵K的第j行,xij表示jth通道对ith通道的影响,之后将X,V相乘,并转换为RC×H×W的格式;
最后,为了提高容错能力,进行乘法运算,通道注意力模块的结果有一个可学习的参数γ,获取最终输出F′∈RC×H×W;
4.根据权利要求3所述的一种基于逐级注意力机制的目标显著性检测方法,其特征在于,空间注意力模块组中的空间注意力模块结构如下:
首先在输入端采用三个1×1的卷积层,并将卷积结果重塑为三个新的特征图Q’,K′和V’,{Q’,K′}∈RC1×N,C1=C/8,V′∈RC×N,之后对转置后的Q′和K′用矩阵乘法,使用softmax正则化后得到空间注意力图X′∈RN×N;
Q′:i是Q′的第i列,K′:j是K′的第j列,x′ij是jth元素对ith元素的影响;将V′和转置后的X′进行矩阵相乘并转换为RC×H×W的格式;与通道注意力模块相同,空间注意力模块也有一个可学习的参数γ′;
γ′初始值为1,基于F′,F″对每个位置得到更丰富的语义关联并增强特征的语义表达。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111536499.4/1.html,转载请声明来源钻瓜专利网。





