[发明专利]隐私保护加权网络发布数据集的构建方法有效
申请号: | 201711038960.7 | 申请日: | 2017-10-31 |
公开(公告)号: | CN107862014B | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 卢俊岭;王小明;张立臣;林亚光 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 西安永生专利代理有限责任公司 61201 | 代理人: | 申忠才 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种隐私保护加权网络发布数据集的构建方法,由确定加权网络原始数据集的候选分割点、从候选分割点中选择实际分割点、构建大权值数据集合和小权值数据集合、确定大权值数据集合和小权值数据集合的平滑敏感度、为大权值数据集合记录和小权值数据集合记录添加拉普拉斯噪音、构建隐私保护加权网络发布数据集步骤组成。本发明与现有的“采用全局敏感度对整个数据集添加拉普拉斯噪音”的方法相比,能够在保证数据满足差分隐私保护的同时降低添加的数据噪音,提高数据可用性,实现隐私保护和数据效用的均衡,可用于隐私保护加权网络发布数据集的构建。 | ||
搜索关键词: | 隐私 保护 加权 网络 发布 数据 构建 方法 | ||
【主权项】:
1.一种隐私保护加权网络发布数据集的构建方法,其特征在于由下述步骤组成:(1)确定加权网络原始数据集的候选分割点加权网络原始数据集的候选分割点由下式确定:ci=(wmax‑wmin)×i/m (1)式中,wmax为
wmin为
v为加权网络原始数据集中记录权值,D为加权网络原始数据集,i为1~10的整数,m为10;(2)从候选分割点中选择实际分割点采用差分隐私指数机制法按下式确定概率oi:oi=exp(ε1×qi/(2Δq)) (2)式中ε1是总隐私预算ε的一半,ε为0.1~1的任意一个实数,qi为权值落入区间[ci‑1,ci]的记录个数,c0为wmin,Δq为1,选择概率最大值对应的候选分割点,作为实际分割点r;(3)构建大权值数据集合和小权值数据集合大权值数据集合和小权值数据集合初始为空集,对加权网络原始数据集中的每个记录进行判断,满足权值大于等于实际分割点r的记录归入大权值数据集合,满足权值小于实际分割点r的记录归入小权值数据集合,构建成大权值数据集合和小权值数据集合;(4)确定大权值数据集合和小权值数据集合的平滑敏感度大权值数据集合的平滑敏感度S*1按下式确定:
小权值数据集合的平滑敏感度S*2按下式确定:
式(3)、(4)中,n1为大权值数据集合记录个数,n2为小权值数据集合记录个数,隐私预算ε2按下式确定:ε2=ε‑ε1; (5)(5)为大权值数据集合记录和小权值数据集合记录添加拉普拉斯噪音大权值数据集合记录的权值按下式添加噪音:
得到加噪后的大权值数据集合记录,其中tj是加噪前的大权值数据集合记录的权值,
是加噪后的大权值数据集合记录的权值,j为1~n1的整数,Lap(S*1/ε2)是拉普拉斯噪音,为实数(‑S*1/ε2)×sign(p‑0.5)×ln(1‑2×|p‑0.5|),S*1是步骤(4)按式(3)得到的大权值集合的平滑敏感度,ε2是步骤(4)按式(5)得到的隐私预算,p是随机产生的0~1的实数;小权值数据集合记录的权值按下式添加噪音:
得到加噪后的小权值数据集合记录,其中ul是加噪前的小权值数据集合记录的权值,
是加噪后的小权值数据集合记录的权值,l为1~n2的整数,Lap(S*2/ε2)是拉普拉斯噪音,为实数(‑S*2/ε2)×sign(p‑0.5)×ln(1‑2×|p‑0.5|),S*2是步骤(4)按式(4)得到的小权值集合的平滑敏感度,ε2是步骤(4)按式(5)得到的隐私预算,p是随机产生的0~1的实数;(6)构建隐私保护加权网络发布数据集将加噪后的大权值数据集合记录、加噪后的小权值数据集合记录首尾合并,构建成隐私保护加权网络发布数据集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711038960.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种日程查找方法和移动终端
- 下一篇:一种关键词关联扩展方法和装置