[发明专利]一种融合差分隐私GAN和PATE模型的表格数据隐私保护方法有效
申请号: | 201910038938.5 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109784091B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 钟尚平;郭鹏;陈开志 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市闽*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 隐私 gan pate 模型 表格 数据 保护 方法 | ||
1.一种融合差分隐私GAN和PATE模型的表格数据隐私保护方法,其特征在于,包括如下步骤:
步骤S1、使用原始表格数据训练差分隐私生成模型;
步骤S2、使用原始表格数据在差分隐私预算下训练教师分类器;
步骤S3、使用差分隐私生成模型生成虚假表格数据及对应生成标签,并使用教师分类器对虚假表格数据预测标签,挑选预测标签和生成标签一致的数据,定义可用数据集,使用可用数据集训练学生分类器;
步骤S4、将差分隐私生成模型和学生分类器发布,数据分析师使用差分隐私生成模型生成数据,而后通过学生分类器挑选数据,完成数据分析;
所述步骤S1中,差分隐私生成模型训练过程包括两部分:生成对抗网络训练和判别模型添加噪音扰动,具体如下:
步骤S11、对抗网络的选择:
辅助分类生成对抗网络使用原始表格数据和标签作为输入,在判别模型部分不仅判别数据真假,还预测数据所属类别,因此选择辅助分类生成对抗网络作为差分隐私生成模型训练网络;
步骤S12、扰动噪音的选择:
差分隐私中添加的噪音大小和查询的敏感度相关,根据隐私预算值和自适应选取设定的梯度裁剪阈值,计算噪音大小;
所述步骤S12,具体实现如下:
首先,为更好的设置梯度裁剪阈值,提出自适应选取设定梯度裁剪阈值:
自适应选取设定梯度裁剪阈值是假定可以接触到与隐私数据同分布的部分公开数据,因此,根据首先使用公开数据训练生成网络,将部分公开数据的平均梯度值设定为隐私数据的梯度裁剪阈值;公式(1)中D,Nc是与隐私数据同分布的可使用公开数据集,每次训练时,从公开数据集采样,根据公式(2)计算梯度,再根据公式(3)计算采样数据的平均梯度,设置隐私数据的梯度裁剪阈值C为平均梯度;
Δf=maxd,d'||f(d)-f(d')|| (6)
g(xi)=g(xi)+N(0,σ2C2I) (8)
公式(5)是根据梯度裁剪阈值C设定的梯度裁剪阈值,对每个输入样例的梯度更新裁剪,当采样的隐私数据的梯度值小于设定的梯度裁剪阈值时,不对梯度值裁剪;当采样的隐私数据的梯度值大于或等于设定的梯度裁剪阈值时,令隐私数据的梯度值为梯度裁剪阈值;给定函数f,通过对f输出添加随机噪音实现差分隐私,噪音的大小取决于f输出的敏感度;如果f输出是向量值,则函数的敏感度Δf定义为公式(6),根据设定的梯度裁剪阈值,那么差分隐私生成模型判别部分的梯度更新的敏感度最大为2*C,公式(7)是差分隐私中噪音的计算公式,ε、δ分别是差分隐私中设定的隐私预算值和隐私暴露概率大小,公式(8)是对梯度值添加噪音N,此处选择高斯噪音实现对梯度值的扰动,以达到对抗网络的隐私保护;
所述步骤S2中,教师分类器采用随机森林算法,结合差分隐私对聚合结果实现噪音扰动,具体如下:
步骤S21、分类模型训练:
基于随机森林算法原理,将原始表格数据分成n个子集,每个子集训练一个分类器,得到n个分类器的集合;
步骤S22、投票结果噪音扰动:
使用分类器集合对输入的数据投票预测标签,并对投票结果添加噪音,实施扰动,满足差分隐私的要求,并最终根据结果确定数据的标签;
所述步骤S3,具体实现如下:
步骤S31、生成模型生成数据:
差分隐私生成模型用于虚假表格数据的生成,基于生成对抗网络的特点,差分隐私生成模型生成虚假表格数据和对应的生成标签;
步骤S32、预测生成数据标签:
虚假表格数据无法人眼分辨好坏,因此结合原始表格数据特征的特点,使用训练好的教师分类器,对虚假表格数据预测标签;
步骤S33、挑选可用数据集:
对预测标签和生成标签的比较,实现对生成的虚假表格数据的挑选,即当生成标签与预测标签一致,则定义数据为可用数据,组成可用数据集,否则舍弃生成的虚假表格数据;
步骤S34、训练学生分类器:
使用可用数据集训练得到学生分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910038938.5/1.html,转载请声明来源钻瓜专利网。