[发明专利]一种基于可分离卷积和注意力机制的图像分类方法有效
申请号: | 201810517380.4 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108985317B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 王松松;李跃进;徐昆然;官俊涛;李奕诗;王东 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安嘉思特知识产权代理事务所(普通合伙) 61230 | 代理人: | 王海栋 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 可分离 卷积 注意力 机制 图像 分类 方法 | ||
1.一种基于可分离卷积和注意力机制的图像分类方法,其特征在于,包括:
S1、构建原始深度卷积神经网络;
S2、利用训练数据集训练所述原始深度卷积神经网络,得到训练的深度卷积神经网络;
S3、将验证数据集输入到所述训练的深度卷积神经网络,得到分类概率向量;
S4、选取所述分类概率向量中概率最大值对应的分类作为数据预处理的测试结果;
S5、将所述测试结果与所述验证数据集的类别标签进行对比,得到最终分类的准确度;
所述S1包括:
S11、构建残差卷积模块、构建可分离卷积模块;
S12、根据所述可分离卷积模块构建注意力机制特征增强模块;
S13、根据所述残差卷积模块、所述注意力机制特征增强模块构建原始深度卷积神经网络;
构建所述可分离卷积模块包括:
依次连接第一可分离卷积层、第一规范化层、第一线性修正单元层、第二可分离卷积层、第二规范化层、第二线性修正单元层、第三可分离卷积层、第三规范化层、逐点加法层,将第一可分离卷积层的输入与第三规范化层的输出逐元素相加,将相加后的结果输出到第三线性修正单元层,构建得到所述可分离卷积模块,其中,所述可分离卷积模块的输出特征的尺寸和输入的尺寸均为H×W×C,H、W、C分别为特征图高度、宽度和通道数,第一可分离卷积层卷积核尺寸为1×1、第二可分离卷积层卷积核尺寸为3×3、第三可分离卷积层卷积核尺寸为1×1;
构建所述注意力机制特征增强模块包括:
依次连接第一最大池化层、第一可分离卷积模块、第二最大池化层、第二可分离卷积模块、第三可分离卷积模块、第一上采样卷积层、逐点加法层、第四可分离卷积模块、第二上采样卷积层、第一可分离卷积层、第二可分离卷积层、S型生长曲线激活函数层,所述第一可分离卷积模块的输出端通过第五可分离卷积模块连接到所述逐点加法层的输入端,构建得到所述注意力机制特征增强模块,其中,第一可分离卷积层卷积核尺寸为1×1、第二可分离卷积层卷积核尺寸为1×1,所述S型生长曲线激活函数层的尺寸和第一最大池化层的输入的尺寸均为H×W×C,H、W、C分别为特征图高度、宽度和通道数,所述第一最大池化层的输入为所述残差卷积模块的输出。
2.根据权利要求1所述的基于可分离卷积和注意力机制的图像分类方法,其特征在于,所述S2包括:
S21、对所述训练数据集进行预处理;
S22、从预处理后的训练数据集中采样M张大小为N*N的第一图像,其中,M、N均为正整数;
S23、对所述第一图像依次做RGB三通道均值处理和随机水平翻转处理,得到第二图像;
S24、将所述第二图像输入到所述原始深度卷积神经网络中,采用随机梯度下降法对所述原始深度卷积神经网络进行优化;
S25、重复执行所述步骤S21-S24,若判断所述原始深度卷积神经网络的损失函数值不再下降时,则将优化后的所述原始深度卷积神经网络作为所述训练的深度卷积神经网络。
3.根据权利要求1所述的基于可分离卷积和注意力机制的图像分类方法,其特征在于,构建所述残差卷积模块包括:
依次连接第一卷积层、第一规范化层、第一线性修正单元层、第二卷积层、第二规范化层、第二线性修正单元层、第三卷积层、第三规范化层、逐点加法层,将第一卷积层的输入与第三规范化层的输出逐元素相加,将相加后的结果输出到第三线性修正单元层,构建得到所述残差卷积模块,其中,所述残差卷积模块的输出特征的尺寸和输入的尺寸均为H×W×C,H、W、C分别为特征图高度、宽度和通道数,第一卷积层卷积核尺寸为1×1、第二卷积层卷积核尺寸为3×3、第三卷积层卷积核尺寸为1×1。
4.根据权利要求1所述的基于可分离卷积和注意力机制的图像分类方法,其特征在于,所述S13包括:
S131、根据所述残差卷积模块、所述注意力机制特征增强模块得到第一模块、第二模块、第一过渡模块、第三模块、第二过渡模块、第四模块、第五模块;
S132、依次连接所述第一模块、第二模块、第一过渡模块、第三模块、第二过渡模块、第四模块、第五模块,得到所述原始深度卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810517380.4/1.html,转载请声明来源钻瓜专利网。