[发明专利]一种基于博弈论的联邦学习隐私策略选择方法在审

专利信息
申请号: 202110292473.3 申请日: 2021-03-18
公开(公告)号: CN112926088A 公开(公告)日: 2021-06-08
发明(设计)人: 林思昕;孙哲;殷丽华;那崇宁;李丹;李超;罗熙;韦南 申请(专利权)人: 之江实验室;广州大学
主分类号: G06F21/62 分类号: G06F21/62;G06N20/00;G06N5/04
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 贾玉霞
地址: 310023 浙江省杭州市余*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 博弈论 联邦 学习 隐私 策略 选择 方法
【权利要求书】:

1.一种基于博弈论的联邦学习隐私策略选择方法,其特征在于,该方法包括:服务器为参与方提供具有不同服务成本的模型质量的权衡参数λMQ与隐私强度的权衡参数λPI的比值λMQPI,参与方根据是否满足服务质量、隐私泄露代价来选择最佳阈值,并用自身数据集训练模型,并把选择的阈值和训练更新的模型参数发给服务器;服务器收集各个参与方的模型参数进一步训练模型,获得优化的模型参数,并更新服务阈值λMQPI和服务成本后再发给参与方,以此服务器保持模型长期稳定的服务状态提供给参与方。

2.如权利要求1所述的基于博弈论的联邦学习隐私策略选择方法,其特征在于,在每次迭代中,服务器计算各个参与方的效用utilityi,以及所有参与方的效用平均值utilityutility=∑utilityi/N;当一位参与方的效用utilityi大于等于总体参与方的效用平均值utility时,下一次迭代时不更改自身策略;否则,下一次迭代时参与方重新选择阈值λMQPI

3.如权利要求1所述的基于博弈论的联邦学习隐私策略选择方法,其特征在于,当参与方采用低质量的数据训练模型时,得不到奖励,即奖励为0,当参与方采用低质量的数据训练模型时,会得到奖励,奖励如下:

其中,x为演化博弈的迭代次数,b为服务器奖励给参与方的收益,qos(ρ,r)=1-(1-ρ)r为模型全局服务质量贡献度函数,ρ为全局服务质量贡献度,rx为在第x次迭代中选择高质量阈值的参与方数量,rfix为每一轮新训练中过时数据的价值,qosexpect为全局服务质量的期望值,p为隐私泄露发生时的价值损失,pdr(σ,r)为参与方隐私的贡献函数,σ为参与方隐私贡献度,Z为参与方选择高质量阈值的概率,N为参与方总数。

4.如权利要求3所述的基于博弈论的联邦学习隐私策略选择方法,其特征在于,服务器通过调节奖励的预算b,使得整个演化博弈模型最终稳定在一个概率Z;该概率Z是指在训练更新模型的过程中,寻找到参与方选择高质量阈值的概率,来保证模型的长期服务质量;通过多轮迭代,最终整个服务训练的参与者有Z的概率选择高质量数据训练模型,1-Z的概率选择低质量数据训练模型,Z的计算方法如下:Z=utility/utilityi

5.如权利要求3所述的基于博弈论的联邦学习隐私策略选择方法,其特征在于:所述参与方的效用utilityi根据数据质量进行区分,具体计算公式如下:

其中,j表示高质量数据的等级,reward(x)表示每轮迭代每位参与方的奖励,cost(x)是每轮迭代每位参与方支出的服务费用。

6.根据权利要求1所述的基于博弈论的联邦学习隐私策略选择方法,其特征在于,该方法包括如下步骤:

步骤S1:服务器通过用不同的阈值λMQPI训练模型,并为每个阈值λMQPI设置不同的服务费;其中,λMQ为模型质量的权衡参数,λPI为隐私强度的权衡参数;

步骤S2:服务器将训练后的模型、不同阈值及其对应的服务费等发给各个参与方选择;

步骤S3:各参与方根据自身对服务质量、隐私保护强度的要求等选择合适的阈值λMQPI,并支付给服务器对应的服务费;

步骤S4:各参与方在选择完毕后,使用本地的数据集训练模型,并把阈值及其对应的费用和更新后的参数发送给服务器;

步骤S5:服务器对各参与方的模型参数进行汇总调整,再次训练模型,并且根据阈值的选择情况重新设置服务费;

步骤S6:服务器将每位参与方选择的阈值λMQPI与服务器设定的阈值范围进行比较,当参与方选择的阈值λMQPI不在服务器设定的阈值范围内时,则认为该参与方选择的是低服务质量,则得不到奖励,效益为0;当参与方选择的阈值λMQPI在服务器设定的阈值范围内时,则认为该参与方选择的是高服务质量;

步骤S7:服务器根据各个参与方的效用utilityi,计算本次迭代的总体参与方的效用平均值utilityutility=∑utilityi/N,并发送给各个参与方;

计算该参与方的效用utilityi如下:

步骤S8:重复步骤S2~步骤S7,当参与方的效用大于等于总体的平均效用值时,参与方保持当前迭代的阈值选择不变;反之,参与方则需要重新选择阈值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;广州大学,未经之江实验室;广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110292473.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top