[发明专利]一种基于泛化域自适应的无监督联邦学习方法有效
| 申请号: | 202110619751.1 | 申请日: | 2021-06-03 |
| 公开(公告)号: | CN113420888B | 公开(公告)日: | 2023-07-14 |
| 发明(设计)人: | 王斌;李港 | 申请(专利权)人: | 中国石油大学(华东) |
| 主分类号: | G06N20/20 | 分类号: | G06N20/20 |
| 代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 李冉 |
| 地址: | 266580 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 泛化 自适应 监督 联邦 学习方法 | ||
本发明公开了一种基于泛化域自适应的无监督联邦学习方法,该方法包括:在联邦学习框架下,基于类别质心的分布式模型参数加权平均聚合方法;发明了特征提取、分类学习两段异步式的学习方法,在源域固定特征分类器训练特征提取,而在目标域固定特征提取器学习特征分类器;提出了基于通信轮数的数据交互方式,不需要每次训练都传递数据,而是在客户端训练多个轮数之后更新服务器上的模型参数。本发明的方法能够应用于分布式无监督场景下面向域泛化的工业互联网场景中,提高了客户端之间的通信效率,保障了用户隐私。基于质心的加权平均方式克服了客户端之间数据量不一致而导致的特征偏移情况,较好的完成了服务器端的特征汇聚,提高了目标域的类别预测准确率。
技术领域
本发明属于计算机科学领域,涉及一种基于泛化域自适应的无监督联邦学习方法。
背景技术
近年来,机器学习得到深入发展,一些提升机器学习性能的技术也应运而生。然而,机 器学习任务通常需要大量已标记数据,尤其是对于训练深度模型来说。众所周知,对数据打 标签是一项既费时又费力的工作。目前,存在各种各样的数据集,但是当一项新任务出现的时候,由于分布差异,在这些数据集上训练的模型不能对新任务有很好的效果。如何在这种 源域和目标域概率分布不一致的情况下进行学习即为域自适应学习问题。
具体来说,在拥有已标记源域数据和未标记目标域数据的情况下学习目标模型就是域自 适应(一般指无监督域自适应)。为了提升适应性能,即目标模型的准确率,往往系统在设计的时候不止使用一个源域。如何通过多源域的学习建立模型应用到分布式客户端中的无标 签数据,得到尽可能高的准确率,是本发明的主要研究场景。因为客户端是分布式结构,要 想获得一个统一的模型在各客户端都保证准确性,需要在训练过程中大量传输数据,这样会 严重影响用户的隐私安全。为了保护隐私,在训练模型的过程当中,域间不能够大量传递数据。联邦学习可以在一定程度上缓解上述问题。联邦学习可以认为是一种分布式机器学习, 分布式客户端间仅需要在训练阶段互相传递梯度而不是数据。但是,联邦对抗域自适应要求 每个源域在每个小批量之后和目标域交换和更新模型参数,这不但降低了准确率而且也会产 生很高的通信成本且容易发生隐私泄露。特别是当目标客户端(目标域)上是无标签数据, 无法参与模型训练,只能被动接受训练好的模型,然后进行标签预测的情况下。如何保证在低通信量的基础上尽可能的提高域间泛化能力,保证目标域的预测准确率,是本发明主要研 究问题。
本发明将包含多域模型泛化均衡在内的整个过程叫做自监督联邦域自适应,主要的步骤 如下:
S1,以联邦学习的架构方式组织的分布式客户端和服务器。客户端的任务是存储数据、 训练模型,服务器的任务是聚合、分发特征梯度。其中,源域客户端上都有带标签的数据, 目标域上的数据没有标签。
S2,将各源域的模型参数发送到服务器端进行聚合,在进行加权平均以后再分发回各个 客户端,经过多轮交互,直到定义的损失函数值最小,代表模型已经收敛。其中,本发明提 出了分段式的异步训练方法。在源域上固定特征分类器,训练特征提取器,而在目标域上固定特征提取器,训练特征分类器。此外,本发明提出服务器上聚合时的加权系数为源域数据 各个分类的质心。
S3,将模型参数传到目标服务器,冻结目标服务器(也称作目标域)上的特征提取器, 开始用目标域上的数据训练目标域的分类器,因为是无标签数据,所以需要采用伪标签技术, 直到信息最大化,训练停止。本步骤的意义是用最小的代价缩小了源域和目标域之间的特征 距离,提高目标域上的信息损失,提高了预测准确率。最后,在目标域上用训练好的特征提取器和分类器预测数据的标签。
本发明的技术方案特征和改进为:
对于步骤S2,本发明提出了多域模型泛化均衡框架,它以联邦平均的机制进行源客户端 (源域)之间的模型交互。不同于常见的客户端之间交互数据、训练、计算梯度,然后更新 各域模型参数的方法。当每个源域在本地训练模型时,会利用标签平滑技术提高模型的泛化 能力。本发明设计的交叉熵损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110619751.1/2.html,转载请声明来源钻瓜专利网。





