[发明专利]一种面向博弈控制的隐私保护方法、系统及可读存储介质在审
申请号: | 202110342166.1 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113158238A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 张纪峰;王继民;康宇;赵延龙;吕文君 | 申请(专利权)人: | 中国科学院数学与系统科学研究院;中国科学技术大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/18 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 金凯 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 博弈 控制 隐私 保护 方法 系统 可读 存储 介质 | ||
1.一种面向博弈控制的隐私保护方法,其特征在于,包括:
初始化博弈参与者在初始时刻的策略和局部估计状态信息;
采用基于输入扰动或输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新;
利用更新后的策略完成差分隐私保护。
2.如权利要求1所述的面向博弈控制的隐私保护方法,其特征在于,所述采用基于输入扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新,包括:
在时刻k,对于参与者定义重复以下更新τk次:
其中,aij,k为参与者i在时刻k分配给邻近参与者的非负权重,为参与者i在时刻k的局部估计状态,博弈参与者之间的通信被建模为无向图其中包含一个非空结点集和一个边集为参与者j在时刻k的局部估计状态;
对于每一个参与者在时刻k+1的局部估计状态进行更新:
其中,xi,k+1为参与者i在时刻k+1的策略,xi,k为参与者i在时刻k的策略,αk为算法的步长,为目标函数的梯度信息,表示在时间k时参与者i的邻域,随机变量ni,k是均值为0,方差为的高斯噪声,为参与者i的动作集合,为参与者j在时刻k的局部估计状态,参与者i在时刻k+1的局部估计状态。
3.如权利要求1所述的面向博弈控制的隐私保护方法,其特征在于,所述采用基于输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新,包括:
在时刻k,对于参与者定义
其中,aij,k为参与者i在第k步分配给邻近参与者的非负权重,为参与者i在时刻k的局部估计状态,博弈参与者之间的通信被建模为无向图其中包含一个非空结点集和一个边集为参与者j在时刻k的局部估计状态;
对于每一个参与者在时刻k+1的局部估计状态进行更新:
其中,Sk是第k步使用的采样梯度数,xi,k+1为参与者i在时刻k+1的策略,xi,k为参与者i在时刻k的策略,为目标函数的梯度信息,α为算法的常步长,为随机变量ξi的采样,表示在时间k时参与者i的邻域,随机变量nj,k是均值为0,方差为的高斯噪声,为参与者i的动作集合,为参与者j在时刻k的局部估计状态,参与者i在时刻k+1的局部估计状态。
4.如权利要求3所述的面向博弈控制的隐私保护方法,其特征在于,还包括采用小批量方法对所述基于输出扰动的随机聚合博弈的差分隐私分布式算法的差分隐私进行优化,包括:
令时刻k=0,对每个参与者有令α>0,Sk为确定性序列;
在时刻k时,对于参与者定义重复以下更新τk次:
其中,aij,k为参与者i在第k步分配给邻近参与者的非负权重,为参与者i在时刻k的局部估计状态,博弈参与者之间的通信被建模为无向图其中包含一个非空结点集和一个边集为参与者j在时刻k的局部估计状态;
对于每一个参与者在时刻k+1的局部估计状态进行更新:
其中,Sk是第k步使用的采样梯度数,xi,k+1为参与者i在时刻k+1的策略,xi,k为参与者i在时刻k的策略,为目标函数的梯度信息,α为算法的步长,为随机变量ξi的采样,表示在时间k时参与者i的邻域,ni,k是均值为0,方差为的高斯噪声,为参与者i的动作集合,参与者i在时刻k+1的局部估计状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院数学与系统科学研究院;中国科学技术大学,未经中国科学院数学与系统科学研究院;中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110342166.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:区块链撮合交易所
- 下一篇:一种红光聚合物电致发光材料及其制备方法