[发明专利]一种基于泛化域自适应的无监督联邦学习方法有效
| 申请号: | 202110619751.1 | 申请日: | 2021-06-03 |
| 公开(公告)号: | CN113420888B | 公开(公告)日: | 2023-07-14 |
| 发明(设计)人: | 王斌;李港 | 申请(专利权)人: | 中国石油大学(华东) |
| 主分类号: | G06N20/20 | 分类号: | G06N20/20 |
| 代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 李冉 |
| 地址: | 266580 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 泛化 自适应 监督 联邦 学习方法 | ||
1.一种基于泛化域自适应的无监督联邦学习方法,其特征在于,具体步骤如下:
S1,以联邦学习的架构方式组织的分布式客户端和服务器,客户端的任务是存储数据、训练模型,服务器的任务是聚合、分发特征梯度,其中,源域客户端上都有带标签的数据,目标域上的数据没有标签;
S2,将各源域的模型参数发送到服务器端进行聚合,在进行加权平均以后再分发回各个客户端,经过多轮交互,直到定义的损失函数值最小,代表模型已经收敛,其中,采用分段式的异步训练方法,在源域上固定特征分类器,训练特征提取器,而在目标域上固定特征提取器,训练特征分类器;服务器上聚合时的加权系数通过源域数据质心和目标域质心获得;
对于步骤S2,采用一种基于质心的源域模型参数加权策略,加权策略定义如下:
假设现在已经拥有K个源域所上传的源模型{w1,w2,…,wK},将它们直接进行平均得到一个初步模型w0:
接着,把w0分发到目标域和每个源域,让它们按照下文中计算质心的方法计算并返回各个类别的质心,此时,假定类别数为L,则每个源域的质心为目标域的质心为每个域上传的一组质心的大小只与类别数和特征向量的大小有关,然后,计算每个源域的质心和目标域对应质心的余弦相似度并求和:
因为余弦相似度的取值范围是[-1,1],为了让sumk非负,最终的和值为:
sumk=sumk+L (6)
最后,利用这个和值来计算权重:
通过获得的权重重新聚合各个源模型;
S3,将模型参数传到目标服务器,冻结目标服务器上的特征提取器,目标服务器也称作目标域,开始用目标域上的数据训练目标域的分类器,采用伪标签技术创建伪标签,进行训练直到信息最大化,最后,在目标域上用训练好的特征提取器和分类器预测数据的标签。
2.根据权利要求1所述的一种基于泛化域自适应的无监督联邦学习方法,其特征在于,对于步骤S2,采用多域模型泛化均衡框架,以联邦平均的机制进行源客户端之间的模型参数交互,源客户端也称作源域,
当每个源域在本地训练模型时,利用标签平滑技术提高模型的泛化能力,交叉熵损失函数为:
在(1)式中,指的是K维向量a的softmax输出中第k个元素,q是一个k维向量,除了正确标签对应的位置是“1”,其余都是“0”,标签平滑被应用到源模型的学习中,加入标签平滑技术之后,损失函数变成了:
其中,K代表类别数,α是平滑系数,设为0.1;
在每一轮通信当中,客户端将各自的模型发送到服务器端并用加权平均的方式进行聚合,最后服务器端将更新后的模型参数分发给每个客户端,这个过程会被执行若干次,直到模型收敛,之后得到的模型是域泛化的结果。
3.根据权利要求1所述的一种基于泛化域自适应的无监督联邦学习方法,其特征在于,对于步骤S2,采用一种基于通信轮数的特征更新策略,规定每次迭代聚合r次模型,r∈Rr≤1,为了执行r轮聚合,将每次迭代平均分成r个阶段,每个阶段结束后聚合模型,r=0.2表示每5次迭代聚合一次;r=1表示每一次迭代聚合一次。
4.根据权利要求1所述的一种基于泛化域自适应的无监督联邦学习方法,其特征在于,对于步骤S3,在训练目标域时,先用训练好的源模型初始化目标模型,然后冻结特征提取器,在训练时参数不更新,开始训练目标模型的分类器,训练时采用固定特征提取器,训练目标模型针对目标域的分类器;
目标模型训练的损失函数由两部分构成,即信息最大化损失和伪标签交叉熵损失;
(1)信息最大化
应用信息最大化损失让概率最大标签的概率尽量大的同时使预测出来的每种类别的标签在数量上基本相同;
IM损失又由Lent和Ldiv两部分组成:
其中,ft(x)=ht(gt(x))是每个目标样本的K维输出,gt表示特征提取器,ht表示分类器,是整个目标域概率向量的按元素运算的均值,Lent(ft;Xt)是让每个样本的预测结果更加确定;Ldiv(ft;Xt)是促进概率向量输出的多样性;
(2)伪标签
对每个未标记数据应用自监督伪标签监督分类器的训练:
首先,通过以下公式得到目标域中每个类的质心:
然后,利用最近质心分类器得到每个样本的伪标签:
Df(a,b)测量的是a,b之间的Cosine距离,具体形式为:
通过以下公式,采用迭代的方式,不断更新目标质心:
因为是通过由无监督方式产生的质心生成的,被称为自监督伪标签;
综上所述,给定源模型fs(x)=hs(gs(x))和上面的伪标签,通过固定特征提取器gt=gs去学习分类器ht,总的目标域的损失函数如下:
其中,β大于等于0,用来控制伪标签交叉熵损失的权重,
算法最终只产生一个结果模型,且源模型和目标模型的训练完全分离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110619751.1/1.html,转载请声明来源钻瓜专利网。





