[发明专利]一种基于可分离卷积和注意力机制的图像分类方法有效
申请号: | 201810517380.4 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108985317B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 王松松;李跃进;徐昆然;官俊涛;李奕诗;王东 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安嘉思特知识产权代理事务所(普通合伙) 61230 | 代理人: | 王海栋 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 可分离 卷积 注意力 机制 图像 分类 方法 | ||
本发明涉及一种基于可分离卷积和注意力机制的图像分类方法,其特征在于,包括:S1、构建原始深度卷积神经网络;S2、利用训练数据集训练所述原始深度卷积神经网络,得到训练的深度卷积神经网络;S3、将验证数据集输入到所述训练的深度卷积神经网络,得到分类概率向量;S4、选取所述分类概率向量中概率最大值对应的分类作为数据预处理的测试结果;S5、将所述测试结果与所述验证数据集的类别标签进行对比,得到最终分类的准确度。本发明提出的基于可分离卷积和注意力机制的图像分类方法,可用于提升深度学习中图像分类模型特征提取的效率和缩减模型的训练参数量,加速模型收敛。
技术领域
本发明属于计算机视觉领域,具体涉及一种基于可分离卷积和注意力机制的图像分类方法。
背景技术
图像分类是计算机视觉领域的一个重要基本问题,也是物体识别的基础。伴随网络购物和社交网络等互联网技术的发展,数字图像的数量也在急剧增长。对这些数字图像的分析、处理、分类提出了更高的要求,高效率,高准确度的分类方法成为了解决此类问题的关键。
现有图像分类的方法有两大类:一是根据计算联合分布概率分类,如高斯模型、隐马尔科夫模型等;二是根据计算条件概率分布分类,如神经网络、支持向量机等。
但是,现有方法对图像中的噪声敏感和细节纹理、颜色信息等重要信息并不敏感,导致不能达到一个很好的分类准确度。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于可分离卷积和注意力机制的图像分离方法。本发明要解决的技术问题通过以下技术方案实现:
本发明实施例提供了一种基于可分离卷积和注意力机制的图像分离方法,包括:
S1、构建原始深度卷积神经网络;
S2、利用训练数据集训练所述原始深度卷积神经网络,得到训练的深度卷积神经网络;
S3、将验证数据集输入到所述训练的深度卷积神经网络,得到分类概率向量;
S4、选取所述分类概率向量中概率最大值对应的分类作为数据预处理的测试结果;
S5、将所述测试结果与所述验证数据集的类别标签进行对比,得到最终分类的准确度。
在本发明的一个实施例中,所述S2包括:
S21、对所述训练数据集进行预处理;
S22、从预处理后的训练数据集中采样M张大小为N*N的第一图像,其中,M、N均为正整数;
S23、对所述第一图像依次做RGB三通道均值处理和随机水平翻转处理,得到第二图像;
S24、将所述第二图像输入到所述原始深度卷积神经网络中,采用随机梯度下降法对所述原始深度卷积神经网络进行优化;
S25、重复执行所述步骤S21-S24,若判断所述原始深度卷积神经网络的损失函数值不再下降时,则将优化后的所述原始深度卷积神经网络作为所述训练的深度卷积神经网络。
在本发明的一个实施例中,所述S1包括:
S11、构建残差卷积模块、构建可分离卷积模块;
S12、根据所述可分离卷积模块构建注意力机制特征增强模块;
S13、根据所述残差卷积模块、所述注意力机制特征增强模块构建原始深度卷积神经网络。
在本发明的一个实施例中,构建所述残差卷积模块,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810517380.4/2.html,转载请声明来源钻瓜专利网。