[发明专利]联邦学习参与方贡献度量方法、装置、存储介质及设备在审
申请号: | 202111215543.1 | 申请日: | 2021-10-19 |
公开(公告)号: | CN113947213A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 章枝宪;李鑫超;周旭华;杨诗友;尹虹舒 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海;袁礼君 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联邦 学习 参与 贡献 度量 方法 装置 存储 介质 设备 | ||
本公开提供了一种联邦学习参与方贡献度量方法、装置、存储介质及设备,涉及机器学习技术领域。该方法包括:确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量,其中,所述各特征是所述各参与方提供的用于训练所述联邦学习模型的数据集中的特征;确定所述各参与方的所有特征的沙普利值的边际贡献量的总和,得到所述各参与方对所述联邦学习模型的贡献量。本公开实施例可更加客观的反映出联邦学习的各参与方对联邦学习模型的贡献价值,提高了评估参与方对联邦学习模型贡献价值的精度。
技术领域
本公开涉及机器学习技术领域,尤其涉及一种联邦学习参与方贡献度量方法、装置、存储介质及设备。
背景技术
目前,联邦学习以及安全多方计算已逐渐成为解决数据安全共享的主要手段和技术。在联邦学习系统中,为了科学合理的分配数据提供方在联邦学习系统中的收益,并激励更多的拥有大数据量和高数据质量的数据提供方加入联邦学习系统,提供一种科学合理的数据提供方贡献量度量措施是必要的。
在相关技术中,可从期望收益分配的角度,考虑期望指标(准确率等)与实际计算值之间的差值,并利用Softmax函数将该差值转换为权重,即为贡献值;但该方式需要第三方参与计算,对收益和损失皆采用期望值进行估计,概率难以界定,无法客观的反映出参与方在联邦学习系统中对联邦学习模型的贡献价值。此外,还可从边际损失的角度衡量数据提供方离开联邦学习系统时所产生的损失,将该损失作为贡献量。该方式同样需要第三方参与计算,且对数据提供方离开联邦学习系统时的损失计算为不放回一次性计算,离开顺序严重影响联邦学习模型性能,测算欠缺公平性,无法客观的反映出参与方在联邦学习系统中对联邦学习模型的贡献价值,此外,该方式计算复杂度高。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开提供一种联邦学习参与方贡献度量方法、装置、存储介质及设备,至少在一定程度上克服相关技术中无法客观的反映出联邦学习参与方对联邦学习模型的贡献价值的问题。
根据本公开的第一个方面,提供了一种联邦学习参与方贡献度量方法,包括:确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量,其中,所述各特征是所述各参与方提供的用于训练所述联邦学习模型的数据集中的特征;确定所述各参与方的所有特征的沙普利值的边际贡献量的总和,得到所述各参与方对所述联邦学习模型的贡献量。
可选的,确定所述各参与方的所有特征的沙普利值的边际贡献量的总和,包括:对于所述各参与方的各特征,计算特征对测试集中样本测试值的实际测试值与该特征对所述样本测试值的期望测试值之间的差值,得到该特征对测试结果的边际贡献量,根据该边际贡献量计算该特征对所述联邦学习模型的沙普利值的边际贡献量。
可选的,确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量,包括:多次对数据集中的样本实例进行随机数值模拟,确定出每次随机数值模拟得到的所述各参与方的各特征对所述联邦学习模型的沙普利值的边际贡献量,其中,所述数据集中包括多个样本实例,各样本实例中包括一个参与方的多个特征;对于所述各参与方的各特征,将在多次随机数值模拟得到的多个边际贡献量的均值作为特征对所述联邦学习模型的沙普利值的边际贡献量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111215543.1/2.html,转载请声明来源钻瓜专利网。