[发明专利]基于横向联邦学习的数据处理系统在审
申请号: | 202110335358.X | 申请日: | 2021-03-29 |
公开(公告)号: | CN113077056A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 蔡文渊;王宇河;高明;钱卫宁;顾海林;徐林昊 | 申请(专利权)人: | 上海嗨普智能信息科技股份有限公司;华东师范大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 丁慧玲 |
地址: | 200434 上海市虹口*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 横向 联邦 学习 数据处理系统 | ||
1.一种基于横向联邦学习的数据处理系统,其特征在于,
包括中心服务器、N个客户端、存储有计算机程序的存储器和处理器,所述处理器在执行所述计算机程序时,实现以下步骤:
步骤S1、初始化全局模型Gglobal,0,设置每轮选取参与训练的客户端数量K,K小于N,设置相似度阈值Q;
步骤S2、选取K个客户端,向每一所选客户端发送初始全局模型Gglobal,0进行第一轮训练,得到第一轮的全局模型Gglobal,1和全局更新矩阵ΔGglobal,1,将训练轮次t设置为2,执行步骤S3;
步骤S3、选取K个客户端,向每一所选客户端发送上一轮全局模型Gglobal,t-1和上一轮全局更新矩阵ΔGglobal,t-1进行第t轮训练,获取第k所选客户端基于Gglobal,t-1和ΔGglobal,t-1训练得到的第t轮本地模型Gk,t和本地更新矩阵ΔGk,t;
步骤S4、获取ΔGk,t和ΔGglobal,t-1的相似度,将相似度大于Q的客户端确定为第t轮目标客户端,第t轮目标客户端的数量为kt,kt小于等于K,则第t轮对应的目标客户端本地模型分别为
步骤S5、将的参数顺序重新匹配,得到第t轮参数顺序调整后的所有目标客户端本地模型G'1,t,G'2,t,G'3,t,......G'kt,t;
步骤S6、基于G'1,t,G'2,t,G'3,t,......G'kt,t获取第t轮全局模型Gglobal,t和第t轮全局更新矩阵ΔGglobal,t;
步骤S7、判断第t轮全局模型是否收敛,若收敛,则结束,否则,令t=t+1,返回步骤S3。
2.根据权利要求1所述的系统,其特征在于,
优选的,所述步骤S2包括:
步骤S21、选取K个客户端,向每一所选客户端发送初始全局模型Gglobal,0;
步骤S22、接收第k所选客户端基于所述初始全局模型进行第一轮训练得到的本地模型Gk,1和更新矩阵ΔGk,1,k的取值为1到K;
步骤S23、基于所选的K个客户端的本地模型和更新矩阵获取第一轮训练得到的全局模型Gglobal,1:
其中,nK为第一轮所选的K个客户端的训练数据总量,nk表示第一轮第k所选客户端的训练数据量;
步骤S24、基于Gglobal,1和Gglobal,0确定第一轮全局更新矩阵ΔGglobal,1:
ΔGglobal,1=Gglobal,1-Gglobal,0。
3.根据权利要求1所述的系统,其特征在于,
优选的,所述步骤S4包括:
步骤S41、将ΔGk,t和ΔGglobal,t-1分别进行矩阵平铺,得到各自对应的更新向量;
步骤S42、获取ΔGk,t对应的更新向量和ΔGglobal,t-1的更新向量的相似度,并与Q比较,将相似度大于Q的ΔGk,t对应的所选客户端确定为第t轮目标客户端。
4.根据权利要求3所述的系统,其特征在于,
所述步骤S4还包括:
步骤S43、将第t轮每一所选客户端对应的更新向量和ΔGglobal,t-1的更新向量的相似度从大到小排序,并获取预设数值的相似度分位数,并将所述相似度阈值Q更新为该相似度分位数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海嗨普智能信息科技股份有限公司;华东师范大学,未经上海嗨普智能信息科技股份有限公司;华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110335358.X/1.html,转载请声明来源钻瓜专利网。