[发明专利]一种基于注意力机制的图像分类方法在审
申请号: | 202110517855.1 | 申请日: | 2021-05-12 |
公开(公告)号: | CN113408577A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 徐智;宁文昌;李智 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 桂林文必达专利代理事务所(特殊普通合伙) 45134 | 代理人: | 张学平 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 图像 分类 方法 | ||
1.一种基于注意力机制的图像分类方法,其特征在于,
包括:基于离散余弦变换对特征图每个通道进行频率分解,得到多个频率分量,用多个所述频率分量联合表示通道全局信息;
基于通道全局信息计算通道注意力权重信息,对特征图各通道基于权重信息加权得到通道注意力机制;
基于自注意力机制计算特征图每个像素的空间注意力权重,再对特征图各空间像素加权求和,以得到空间注意力机制;
将通道注意力机制和空间注意力机制嵌入到ResNet,得到图像分类卷积神经网络,并对所述图像分类卷积神经网络进行训练。
2.如权利要求1所述的一种基于注意力机制的图像分类方法,其特征在于,
所述基于离散余弦变换对特征图每个通道进行频率分解,得到多个频率分量,用多个所述频率分量联合表示通道全局的具体步骤是:
对特征图的每个通道计算二维离散余弦变换,得到多个频率分量;
选择3个频率分量拼接成向量。
3.如权利要求2所述的一种基于注意力机制的图像分类方法,其特征在于,
所述基于通道全局信息计算通道注意力权重信息,对特征图各通道基于权重信息加权得到通道注意力机制的具体步骤是:
用一维卷积对所述向量进行降维;
对一维卷积得到的向量使用全连接层再进行一次降维;
将全连接层降维后的向量经过非线性激活函数处理;
将非线性激活函数输出的向量再经过一层全连接层升维成与特征图通道数相同的维数并使用sigmoid函数归一化,得到通道注意力分布;
根据通道注意力分布对特征图进行加权,得到通道注意力模块的输出。
4.如权利要求1所述的一种基于注意力机制的图像分类方法,其特征在于,
所述基于自注意力机制计算特征图每个像素的空间注意力权重,再对特征图各空间像素加权求和,以得到空间注意力机制的具体步骤是:
对特征图的每个像素计算query、key和value三个向量;
遍历输入特征图的每个像素,计算每个query向量与输入特征图所有像素的key向量之间的相关性,得到相关性分布图;
基于相关性分布图对输入特征图所有像素的value向量进行加权求和,得到输出特征图中对应位置处的像素值。
5.如权利要求4所述的一种基于注意力机制的图像分类方法,其特征在于,
所述query是查询向量,代表与学习任务相关的信息,所述key是键向量,代表像素本身的属性,所述value是值向量,代表像素的特征表示。
6.如权利要求1所述的一种基于注意力机制的图像分类方法,其特征在于,
所述将通道注意力机制和空间注意力机制嵌入到ResNet,得到图像分类卷积神经网络,并对所述图像分类卷积神经网络进行训练的具体步骤是:
将通道注意力嵌入到网络的浅层结构块组:conv2_x,conv3_x,conv4_x,将空间注意力嵌入到网络的深层结构块组:conv5_x;
通道注意力接在残差块的卷积模块后面,而空间注意力则替换残差块的卷积模块中的3×3卷积层,得到图像分类卷积神经网络;
对所述图像分类卷积神经网络进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110517855.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能水枪喷射器及其操作方法
- 下一篇:轴瓦止动装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序