[发明专利]一种基于联邦学习的隐私保护图像分类方法在审
申请号: | 202110975055.4 | 申请日: | 2021-08-24 |
公开(公告)号: | CN113642664A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 杜磊;许艳;仲红;刘辉 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06F21/62 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230601 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联邦 学习 隐私 保护 图像 分类 方法 | ||
1.一种基于联邦学习的隐私保护图像分类方法,其特征是应用于由服务器、洗牌器和N个客户端所组成的网络中,并按如下步骤进行:
步骤1.所述服务器获取无标记的公共数据并进行归一化预处理,得到预处理后的公共数据集记为DP={x1,x2,...,xk,...,xK},xk表示第k个公共样本,k=1,2,...,K,K为公共样本的总数;
步骤2.所述服务器初始化并通过洗牌器下发数据至各客户端:
步骤2.1.所述服务器生成公钥pk和私钥sk;
步骤2.2.所述服务器构造全局神经网络MG;
步骤2.3.所述服务器将公钥pk、全局神经网络MG和公共数据集DP发送给所述洗牌器;
步骤3.所述客户端训练本地神经网络:
步骤3.1.第i个客户端获取本地真实数据并进行归一化预处理,得到预处理后的本地数据集记为Di={(xi,1,yi,1),(xi,2,yi,2),...,(xi,j,yi,j),...,(xi,J,yi,J)},xi,j和yi,j分别表示第i个客户端的第j个本地样本和对应的标记,i=1,2,...,N,N为客户端总数,j=1,2,...,J,J为本地样本总数;
步骤3.2.第i个客户端根据式(1)计算本地的全局神经网络MGi的预测结果与本地样本标记之间的交叉熵损失并作为训练所述本地神经网络的监督损失,再使用随机梯度下降优化方法以学习率lriL来更新所述本地神经网络的权值,并在监督损失值趋于稳定时完成对所述本地神经网络MGi的训练;
式(1)中,为符号函数,表示第i个客户端的第j个本地样本的类别,若表示第j个本地样本的类别属于类别c,若表示第j个本地样本的类别不属于类别c;表示第i个客户端的本地的全局神经网络MGi预测第j个本地样本属于类别c的概率;c∈[1,m],m为类别数;
步骤4.所述洗牌器对客户端进行随机子采样,得到S个子采样后的客户端用于预测第k个公共样本xk;
步骤5.任意第s个子采样客户端预测公共样本xk后,扰动并加密后发送给洗牌器,s=1,2,...,S:
步骤5.1.第s个子采样客户端利用训练后的本地神经网络MGs计算公共数据集DP中各个公共样本的预测值{fs(x1),fs(x2),...,fs(xk),...,fs(xK)};其中,fs(xk)表示第s个子采样客户端计算的第k个公共样本xk的预测值;
步骤5.2.第s个子采样客户端将预测值{fs(x1),fs(x2),...,fs(xk),...,fs(xK)}进行one-hot编码,得到编码预测值{ys,1,ys,2,...,ys,k,...,ys,K},其中,ys,k表示第k个公共样本xk的预测值fs(xk)的one-hot编码,且yi,k∈{0,1}m;
步骤5.3.第s个子采样客户端根据式(2)计算扰动后的本地预测值{y′s,1,y′s,2,...,y′s,k,...,y′s,K},其中,y′s,k表示第s个子采样客户端的第k个公共样本xk的编码预测值ys,k扰动后的预测值;
式(2)中,Pr表示概率;Perturb(·)表示扰动函数;ys,k[b]和y′s,k[b]分别表示第s个子采样客户端的第k个公共样本xk的编码预测值ys,k的第b位和扰动后的预测值y′s,k的第b位,b∈[1,m];ε表示客户端分配给每个编码预测值的隐私预算;
步骤5.4.第s个子采样客户端使用公钥pk将扰动后的预测值y′s,k加密后发送给所述洗牌器;
步骤6.所述洗牌器伪造并随机排列预测后,将匿名预测发送给服务器:
步骤6.1.对于第k个公共样本xk,所述洗牌器伪造虚假预测值并利用公钥pk加密,其中,表示所述洗牌器对第k个公共样本xk伪造的第h个虚假预测值,且且表示第h个虚假预测值的第b位,且满足二项分布,h=1,2,...,H,H为虚假预测总数;
步骤6.2.对于第k个公共样本xk,所述洗牌器删除所有对应的第s个子采样客户端的本地预测值{y′s,1,y′s,2,...,y′s,k,...,y′s,K}的身份信息后,再与虚假预测值进行合并,对合并后的信息进行随机排列,并得到匿名预测值并发送给服务器,其中,表示第k个公共样本xk的第a个匿名预测值,a=1,2,...,A,A为匿名预测总数,A=S+H;
步骤7.所述服务器聚合匿名预测值并训练全局模型:
步骤7.1.所述服务器利用私钥sk解密对应的匿名预测值后,根据式(3)对解密后的预测值进行聚合,得到第k个公共样本xk单一的全局预测并作为第k个公共样本xk的聚合标记,从而得到聚合标记后的公共数据集
式(3)中,argmax(·)表示寻找具有最大值的参数;
步骤7.2.所述服务器根据式(4)计算全局神经网络MG的预测结果与公共样本的聚合标记之间的交叉熵损失并作为训练所述全局神经网络MG的监督损失,使用随机梯度下降优化方法以学习率来更新所述全局神经网络MG的权值,并在监督损失值趋于稳定时完成对所述全局神经网络MG的训练;
式(4)中,为符号函数,表示公共数据DP中第k个样本xk的类别,若表示第k个样本xk的类别属于c类,若表示第k个样本xk的类别不属于c类;pkc表示全局神经网络MG预测的第k个公共样本xk属于类别c的概率;
步骤8.所述服务器将训练好的全局神经网络MG下发至各客户端,第i个客户端利用训练好的全局神经网络MG进行图像分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110975055.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有均匀反光性能的塑胶
- 下一篇:一种舰船辐射噪声数据集的构建方法