[发明专利]联邦机器学习的方法和服务器在审
| 申请号: | 201980102933.2 | 申请日: | 2019-12-10 |
| 公开(公告)号: | CN114787832A | 公开(公告)日: | 2022-07-22 |
| 发明(设计)人: | P·克里希纳斯瓦米;L·阿南塔拉曼;F·古列特诺;何勉 | 申请(专利权)人: | 新加坡科技研究局 |
| 主分类号: | G06N20/20 | 分类号: | G06N20/20;G06N3/08;G06F16/50 |
| 代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 罗朗;王卫彬 |
| 地址: | 新加坡*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 联邦 机器 学习 方法 服务器 | ||
1.一种使用至少一个处理器的联邦机器学习的方法,所述方法包括:
将当前全局机器学习模型传输到复数个数据源中的每一个;
分别从所述复数个数据源接收复数个训练更新,所述复数个训练更新中的每一个由相应的所述数据源响应于接收到的所述全局机器学习模型而生成;并且
分别基于接收到的所述复数个训练更新以及与所述复数个数据源相关联的复数个数据质量参数来更新所述当前全局机器学习模型,以生成更新的全局机器学习模型。
2.根据权利要求1所述的方法,其中,所述复数个训练更新中的每一个是由相应的所述数据源基于接收到的所述全局机器学习模型以及由相应的所述数据源存储的标签数据生成的。
3.根据权利要求2所述的方法,其中,所述复数个训练更新中的每一个包括所述当前全局机器学习模型和由相应的所述数据源基于所述当前全局机器学习模型以及由相应的所述数据源存储的标签数据进行训练的本地机器学习模型之间的差异。
4.根据权利要求1所述的方法,其中,所述更新所述当前全局机器学习模型包括分别基于与所述复数个数据源相关联的所述复数个数据质量参数确定所述复数个训练更新的加权平均值。
5.根据权利要求2所述的方法,其中,所述由相应的所述数据源存储的标签数据包括特征和标签,与相应的所述数据源相关联的数据质量参数包括与所述特征相关联的特征质量参数和与所述标签相关联的标签质量参数中的至少一种。
6.根据权利要求5所述的方法,其中,所述复数个数据质量参数中的一个或多个分别基于第一数据质量因子、第二数据质量因子以及第三数据质量因子中的至少一个,其中所述第一数据质量因子涉及对应数据源的质量,所述第二数据质量因子涉及由所述对应数据源存储的标签数据的质量,所述第三数据质量因子涉及数据不确定性的统计推导。
7.根据权利要求6所述的方法,其中,所述第一数据质量因子基于以下至少一个:与所述数据源关联的信誉级别,由所述对应数据源存储的标签数据的一个或多个数据注释者的能力级别,以及与用于生成由所述对应数据源存储的标签数据的注释方法的类型相关联的方法值,其中,所述标签数据的特征与图像相关,所述第二数据质量因子基于图像采集特征以及图像中图像伪影水平中的至少一个。
8.根据权利要求1所述的方法,还包括:
将多个数据源分箱成复数个质量范围;并且
从所述多个数据源中选择所述复数个数据源。
9.根据权利要求1所述的方法,其中,所述复数个数据质量参数为复数个数据质量指标。
10.一种用于联邦机器学习的服务器,包括:
存储器,
至少一个处理器,通信地耦合到所述存储器并被配置为:
将当前全局机器学习模型传输到复数个数据源中的每一个;
分别从所述复数个数据源接收复数个训练更新,所述复数个训练更新中的每一个由相应的所述数据源响应于接收到的所述全局机器学习模型而生成;并且
分别基于接收到的所述复数个训练更新以及与所述复数个数据源相关联的复数个数据质量参数来更新所述当前全局机器学习模型,以生成更新的全局机器学习模型。
11.根据权利要求10所述的服务器,其中,所述复数个训练更新中的每一个是由相应的所述数据源基于接收到的所述全局机器学习模型以及由相应的所述数据源存储的标签数据生成的。
12.根据权利要求11所述的服务器,其中,所述复数个训练更新中的每一个包括所述当前全局机器学习模型和由相应的所述数据源基于所述当前全局机器学习模型以及由相应的所述数据源存储的标签数据进行训练的本地机器学习模型之间的差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新加坡科技研究局,未经新加坡科技研究局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980102933.2/1.html,转载请声明来源钻瓜专利网。





