[发明专利]一种基于注意力机制的卷积神经网络构建方法及应用有效
| 申请号: | 201810468476.6 | 申请日: | 2018-05-16 |
| 公开(公告)号: | CN108734290B | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 王改华;袁国亮;吕朦;刘文洲;李涛 | 申请(专利权)人: | 湖北工业大学 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
| 地址: | 430068 湖北*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 机制 卷积 神经网络 构建 方法 应用 | ||
本发明公开一种基于注意力机制的卷积神经网络构建方法及应用,包括用于对图像进行预处理的基本卷积操作层,用于提取图像浅层显著特征的注意力机制层1,用于提取图像深层显著特征的注意力机制层2,用于提取图像最深层显著特征的注意力机制层3,用于将注意力机制层3中的2维输出数据捋平为1维的两个全连接层,以及SoftMax分类器。本发明将注意力机制融合进卷积神经网络中,有效的促进了卷积神经网络提取有效的信息从而提高网络性能,提升网络收敛效率和精度。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于注意力机制的卷积神经网络构建方法及该卷积神经网络在图像分类方面的应用。
背景技术
视觉注意力机制是人类视觉所特有的大脑信号处理机制。人类视觉通过快速扫描全局图像,获得需要重点关注的目标区域,也就是一般所说的注意力焦点,而后对这一区域投入更多注意力资源,以获取更多所需要关注目标的细节信息,而抑制其他无用信息。
现代计算机视觉的典型的框架之一卷积神经网络近年来被广泛应用于图像处理领域。其主要应用之一则是模式识别和图像分类,现阶段,如何提高卷积神经网络的效率和识别率是两个亟需解决的问题。从卷积神经网络的提出开始,很多科研工作者对其进行了研究并提出改进措施。卷积神经网络的基本结构由输入层、卷积层、池化层、全连接层及输出层。其中最核心的是与卷积层相关的卷积操作和与池化层相关的池化操作。本专利从卷积神经网络的特点出发,提出了一种改进的神经网络模型,实验结果表示,该方法较传统的卷积网络而言,具有收敛速度更快,精确度更高的优点。
发明内容
针对现有卷积神经网络在图像识别效率和识别率低的问题,本发明提出了一种基于注意力机制的卷积神经网络构建方法及其在图像识别上的应用。
本发明所采用的技术方案包括以下步骤:
步骤1,建立用于对图像进行预处理的基本卷积操作层,包括2个卷积层和2个池化层,其中卷积层和池化层相间隔;
步骤2,构造用于提取图像浅层显著特征的注意力机制层1,包括两个相互连接的包含注意力机制的神经网络模块和池化层;
步骤3,构造用于提取图像深层显著特征的注意力机制层2,包括五个相互连接的包含注意力机制的神经网络模块和池化层;
步骤4,构造用于提取图像最深层显著特征的注意力机制层3,包括两个相互连接的包含注意力机制的神经网络模块和池化层;
步骤5,建立用于将注意力机制层3中的2维输出数据捋平为1维的两个全连接层;
步骤6,选取SoftMax分类器。
进一步的,所述包含注意力机制的神经网络模块的构建方式如下,
1)输入x与n1个1X1的卷积核进行卷积得到n1个特征图(map1-n1);
2)输入x与n2个1X1的卷积核进行卷积得到n2个特征图(map1-n2),然后map1-n2与n3个3X3的卷积核进行卷积得到n3个特征图map1-n3;
3)输入x与n4个1X1的卷积核进行卷积得到n4个特征图(map1-n4),然后map1-n4与n5个3X3的卷积核进行卷积得到n5个特征图map1-n5;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810468476.6/2.html,转载请声明来源钻瓜专利网。





