[发明专利]一种基于注意力机制的神经网络正则化方法在审
申请号: | 202111216830.4 | 申请日: | 2021-10-19 |
公开(公告)号: | CN114092779A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 李建军;李胜炎;周云帆;俞杰;陆奇;唐政;惠国宝;赵露露;田万勇;李新付 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06K9/62;G06V10/764;G06V10/46;G06N3/04;G06N3/08;G06V10/26 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 神经网络 正则 方法 | ||
1.一种基于注意力机制的神经网络正则化方法,其特征在于包括以下步骤:
步骤1、批量图像的预处理:包括随机裁剪、随机翻转、正则化操作;
步骤2、利用权重共享的编码器网络进行特征提取:将预处理后的训练图像输入Resnet模型,从Resnet模型的任意中间层提取高维特征图,该中间层之前的网络即是权重共享的编码器网络,提取到的高维特征图将用于之后的特征重构,特征重构后的特征图将重新输入该中间层之后的网络进行训练;
步骤3、利用注意力机制进行关键特征筛选:通过步骤2骤得到高维特征图,将这些高维特征图输入注意力提取网络SENet,利用注意力机制筛选并提取特征图中的关键特征;
步骤4、交换不同目标图像的关键特征:随机选取一张特征图上的关键特征替换另一特征图上的关键特征,得到一张新的重构特征图,该重构特征图包含了两张图像目标的信息;
步骤5、当前图像的关键特征和另一图像的补充特征共同组成重构图像的语义信息:重构特征图包含了一张特征图上的关键特征和另一特征图上的补充特征;
步骤6、设计一种自适应置信度估计方法,判断重构图像的所属类别:新的重构特征图包含了两张图像的目标信息,利用自适应置信度估计的方法,评估重构特征图所属目标类别的概率大小;
步骤7、利用重构图像对神经网络进行训练得到更准确的训练模型:通过上述步骤得到了重构特征图及其标签,因此可以使用重构的特征图进行网络训练,充分挖掘神经网络的学习潜力,增强模型鲁棒性。
2.根据权利要求1所述的一种基于注意力机制的神经网络正则化方法,其特征在于步骤(1)中输入的批量图像可以是任意数据集的。
3.根据权利要求1所述的一种基于注意力机制的神经网络正则化方法,其特征在于步骤2得到特征图的步骤具体是:将图像输入Resnet模型后,随机选择一中间层进行正则化操作;该中间层之前的网络为权重共享的编码器网络;该中间层的输出就是要提取的批量图像的高维特征图,记为其中c、h、w分别表示特征图的通道数、高、宽。
4.根据权利要求3所述的一种基于注意力机制的神经网络正则化方法,其特征在于步骤(3)中利用注意力机制进行关键特征筛选的步骤具体是:
4-1将步骤2得到的高维特征图输入通道注意力网络SENet中,进行注意力评分,注意力得分的越高表示该特征图对分类性能贡献越大;
4-2将c个通道的特征图按照注意力得分的高低进行排序。
5.根据权利要求4所述的一种基于注意力机制的神经网络正则化方法,其特征在于步骤(4)中的提取目标图像的关键特征,具体是是选择注意力得分最高的部分通道特征图,所述的部分通道是选择c/2个通道。
6.根据权利要求5所述的一种基于注意力机制的神经网络正则化方法,其特征在于步骤5中当前图像的关键特征和另一图像的补充特征共同组成重构图像的语义信息,关键特征来自步骤4,补充特征来自另一图像除关键通道之外对应的特征图。
7.根据权利要求6所述的一种基于注意力机制的神经网络正则化方法,其特征在于步骤6中自适应置信度估计方法的步骤具体是:
6-1根据步骤5得到包含两张图像目标信息的重构特征图;
6-2将重构特征图重新输入Resnet模型在步骤2提取的中间层,并进行整个Resnet网络的训练,并在最后的网络输出层得到不同类别的预测概率
6-3从预测概率中选取重构特征图对应的原图所属的两个类别的概率PA和PB作为自适应置信度的结果,则自适应置信度为:
[λA,λB]=soft max([PA,PB])=[0.67,0.33]
6-4重构特征图所对应的原图类别与自适应置信度共同组成重构图像的训练标签,训练的目标函数可表示为:
其中,λA,λB分别为目标类别yA和yB的置信度,使用的是交叉熵损失函数LCE,是预测输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111216830.4/1.html,转载请声明来源钻瓜专利网。