[发明专利]一种联邦学习方法及相关装置在审
申请号: | 202310377345.8 | 申请日: | 2023-03-31 |
公开(公告)号: | CN116468114A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 宛烁;邵云峰;陈熙 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/098 | 分类号: | G06N3/098;G06N3/0464;G06N3/048 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 罗晓敏 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联邦 学习方法 相关 装置 | ||
1.一种联邦学习方法,其特征在于,包括:
获取多个模型,所述多个模型是从多个节点获取到的;
根据所述多个模型的网络结构,将所述多个模型分为多个组别,其中所述多个组别中的每个组别包括至少一个模型,且同一个组别中的模型具有相同的网络结构;
对所述多个组别的每个组别中的模型进行参数聚合,得到多个聚合模型,其中同一个组别中的模型被聚合得到一个聚合模型,所述多个聚合模型对应于所述多个组别;
以所述多个模型为教师模型,分别对所述多个聚合模型中的每个聚合模型执行知识蒸馏训练,得到多个训练后的模型;
向所述多个节点发送所述多个训练后的模型。
2.根据权利要求1所述的方法,其特征在于,所述以所述多个模型为教师模型,分别对所述多个聚合模型中的每个聚合模型执行知识蒸馏训练,得到多个训练后的模型,包括:
将训练样本分别输入第一聚合模型以及所述多个模型,得到目标预测结果和多个预测结果,其中所述第一聚合模型为所述多个聚合模型中的任意一个模型,所述目标预测结果对应于所述第一聚合模型,所述多个预测结果对应于所述多个模型;
基于损失函数训练所述第一聚合模型,得到训练后的第一聚合模型,所述损失函数是基于所述目标预测结果与所述多个预测结果之间的差异得到的。
3.根据权利要求2所述的方法,其特征在于,所述损失函数是基于所述目标预测结果与所述多个预测结果中每个预测结果之间的差异得到的;
或者,所述损失函数是基于所述目标预测结果与所述多个预测结果的加权平均值之间的差异得到的。
4.根据权利要求2或3所述的方法,其特征在于,所述损失函数包括第一子损失函数和第二子损失函数,所述第一子损失函数是基于所述目标预测结果与所述多个预测结果之间的差异得到的,所述第二子损失函数是基于所述训练样本的真实标签与所述目标预测结果之间的差异得到的。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述方法还包括:
基于训练数据,在所述多个训练后的模型中确定目标模型;
以所述多个训练后的模型为教师模型,对所述目标模型执行知识蒸馏训练,得到更新后的目标模型,所述更新后的目标模型用于执行基于本地数据的推理任务。
6.根据权利要求5所述的方法,其特征在于,所述基于训练数据,在所述多个训练后的模型中确定目标模型,包括:
将所述训练数据分别输入多个模型中的每个模型,并基于所述每个模型输出的预测结果确定所述每个模型的预测精度;
基于所述每个模型的预测精度确定所述目标模型,所述目标模型包括所述多个训练后的模型中预测精度最高的一个或多个模型。
7.根据权利要求5所述的方法,其特征在于,所述基于训练数据,在所述多个训练后的模型中确定目标模型,包括:
将所述训练数据输入门网络,得到所述门网络输出的多个权重值,所述多个权重值与所述多个训练后的模型一一对应,所述多个权重值分别用于表示所述多个训练后的模型的输出结果在加权求和过程中的权重,所述门网络为预先训练得到的网络;
根据所述多个权重值确定所述目标模型,所述目标模型包括所述多个训练后的模型中对应权重值最高的一个或多个模型。
8.根据权利要求1-7任意一项所述的方法,其特征在于,所述向所述多个节点发送所述多个训练后的模型,包括:
根据目标数据,在所述多个训练后的模型中确定部分训练后的模型,所述目标数据为从第一节点获取到的数据,所述部分训练后的模型是所述多个训练后的模型中在处理所述目标数据时具有最优性能的模型;
向所述第一节点发送所述部分训练后的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310377345.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:袋型葫芦膜自动包装机
- 下一篇:车辆信息处理方法及装置、存储介质、计算机设备