[发明专利]基于自注意力机制和最小二乘的条件对抗领域自适应方法在审
申请号: | 202210041161.X | 申请日: | 2022-01-14 |
公开(公告)号: | CN114387475A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 赵立权;贾雁飞;钟铁 | 申请(专利权)人: | 东北电力大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京盛询知识产权代理有限公司 11901 | 代理人: | 陈巍 |
地址: | 132012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 最小 条件 对抗 领域 自适应 方法 | ||
本发明属于迁移学习技术领域,具体的说是基于自注意力机制和最小二乘的条件对抗领域自适应方法,该方法包括如下;通过自注意力机制的特征提取网络和最小二乘的条件形成对抗领域自适应损失函数;并提出使用最小二乘损失函数代替条件对抗领域自适应方法中的交叉熵损失函数,解决算法模型出现模式崩塌、梯度消失以及训练过程不稳定等问题;基于自注意力机制和最小二乘的条件对抗领域自适应方法具有训练过程稳定,数据集分类任务精度高和收敛速度快等优点。
技术领域
本发明涉及迁移学习技术领域,具体是基于自注意力机制和最小二乘的条件对抗领域自适应方法。
背景技术
深度学习是人工智能研究领域中的重要研究方向之一,它通过模拟人的大脑,将每一层网络都看作为人脑的一组神经元,通过多层网络不断叠加从而使得机器能够完成和人脑一样的任务;虽然深度学习在各个领域内都有着很好的应用效果,但也存在着一定局限性;其对训练集和测试集要求方面必须满足相同的数据分布特性,同时满足数据具备标签的条件;然而在现实世界中,随着大数据时代的来临,数据虽然爆炸式增长,但并不是出现的数据都拥有其对应的标签,而且对每一个数据集中的数据都分别进行标注又是个极其耗费金钱和时间的工作,为了解决以上问题,人们提出了迁移学习。
条件对抗领域自适应相关算法依然存在以下问题:条件对抗领域自适应算法中的由于仅使用卷积网络提取特征导致无法捕捉远距离像素信息关系,进而使得算法的分类任务精度下降和使用交叉熵损失函数的使用所导致的模型训练不稳定、梯度消失、模式崩塌的问题;因此,针对上述问题提出基于自注意力机制和最小二乘的条件对抗领域自适应方法。
发明内容
为了弥补现有技术的不足,解决条件对抗领域自适应算法中的由于仅使用卷积网络提取特征导致无法捕捉远距离像素信息关系,进而使得算法的分类任务精度下降和使用交叉熵损失函数的使用所导致的模型训练不稳定、梯度消失、模式崩塌的问题,本发明提出基于自注意力机制和最小二乘的条件对抗领域自适应方法。
本发明解决其技术问题所采用的技术方案是:本发明所述的基于自注意力机制和最小二乘的条件对抗领域自适应方法,该方法包括如下;通过自注意力机制的特征提取网络和最小二乘的条件形成对抗领域自适应损失函数。
优选的,所述自注意力机制引入到特征提取网络中,根据非局部神经网络的思想,定义自注意力机制层表示形式如式(1)所示:
式中,x表示Resnet-50网络层的输入图像特征矩阵;xi表示特征矩阵中的第i个元素;xj表示特征矩阵中的第j个元素;N表示所有特征矩阵元素数量之和;
通过式(1)看出γi,j与xi、xj都有着直接关系,所以任何一对特征矩阵中的元素输入到自注意力机制层均会直接影响到该层的输出;γi,j表示特征矩阵中元素xi和xj之间的关联性指标;由于自注意力模块是非局部嵌入高斯模型的一种特殊形式,则式(1)中f(xi,xj)表示为:
其中θ(xi)和φ(xj)具体表达方式如式(3)和(4)所示:
θ(xi)=Wθ*xi (3)
式中,Wθ、均表示卷积操作,其中卷积核为1x1且信道尺寸为输入信道的1/8;θ(xi)、均表示卷积网络组成的特征空间,其作用是减少每个卷积核的通道数量和参数,进而降低算法运算复杂度;
因此,根据式(2)—(4),将式(1)改写为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北电力大学,未经东北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210041161.X/2.html,转载请声明来源钻瓜专利网。