[发明专利]基于小波变换的差分隐私数据发布方法有效
申请号: | 201510041710.3 | 申请日: | 2015-01-27 |
公开(公告)号: | CN104573560B | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 管海兵;姚建国;马汝辉;李健;邓煜 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 上海新天专利代理有限公司 31213 | 代理人: | 张宁展 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 小波变换 隐私保护 原始数据集 隐私数据 树结构 噪音 发布数据 选择算法 叶子节点 一步一步 自顶向下 数据集 预定义 再利用 最顶层 发布 协同 引入 转化 | ||
本发明公开了一种基于小波变换的差分隐私数据发布方法。通过把原始数据集的属性取值概括为预定义概括树结构中最顶层的取值,再利用概括树结构自顶向下的细分取值,一步一步把概括化的属性值转化为细分的属性值。在选择属性进行细分的选择算法上,利用已有的指数加噪方法;在叶子节点的加噪中引入了小波变换的加噪方法,使得在满足差分隐私保护的前提下,尽量减少新发布数据集相对原始数据集的噪音。本发明结合小波变换和指数机制协同加噪,有效的减少了在对原始数据集加噪过程中噪音的累积,并且符合差分隐私保护的定义,减少了隐私保护的代价,有效提高了差分隐私保护后数据集的利用率。
技术领域
本发明涉及计算机数据挖掘、数据隐私保护技术领域,具体地,涉及一种基于小波变化的差分隐私数据发布方法,用于解决差分隐私数据发布过程中噪音量过大的问题。
背景技术
信息技术的飞速发展使得各类数据的发布、采集、存储和分析变得方便快捷.例如,医院电子病例记录病人基本信息、疾病信息及药品购买记录;人口普查记录市民的家庭住址以及收入情况;金融业务服务会记录客户私有信息及其交易行为等,而这些数据的收集和发布直接给个人隐私造成威胁。
隐私保护技术可以解决数据发布和数据分析带来的隐私威胁问题,如何发布和分析而又不泄露隐私信息是隐私保护技术的主要目的。已有的基于k匿名或者划分的隐私保护方法,只适应特定背景知识下的攻击而存在严重的局限性。差分隐私作为一种新出现的隐私保护框架,能够防止攻击者拥有任意背景知识下的攻击并提供有力的保护。该模型不关心攻击者拥有多少背景知识,通过向查询或者分析结果中添加适当噪音来达到隐私保护效果,类似传统的隐私保护技术,实施差分隐私保护技术主要考虑两个方面的问题:(1)如何保证设计的算法满足差分隐私,以确保数据隐私不被泄露;(2)如何减少噪音带来的误差,以提高数据的可用性。
差分隐私的形式化定义如下:
定义1:给定数据集D和D',二者互相之间至多相差一条记录,即|DΔD'|≤1.给定一个隐私算法A,Range(A)为A的取值范围,若算法A在数据集D和D'上任意输出结果O(O∈Range(A))满足下列不等式,则A满足ε差分隐私:
其中,概率Pr[·]由算法A的随机性控制,也表示隐私被披露的风险;隐私预算参数ε表示隐私保护程度,ε越小隐私保护程度越高。从定义1可以看出差分隐 私技术限制了任意一条记录对算法A输出结果的影响.该定义是从理论角度确保算法A满足ε差分隐私,而要实现差分隐私保护需要噪音机制的介入。
噪音机制是实现差分隐私保护的主要技术,常用的噪音添加机制分别为拉普拉斯机制与指数机制。而基于不同噪音机制且满足差分隐私的算法所需噪音大小与全局敏感性(Global Sensitive)密切相关。
定义2.对于任意一个函数:f:D→Rd,函数f的全局敏感性为:
其中,D和D'至多相差一条记录,R表示所映射的实数空间,d表示函数f的查询维度,p表示度量Δf使用的Lp距离,通常使用L1来度量。
拉普拉斯机制通过拉普拉斯分布产生的噪音扰动真实输出值来实现差分隐私保护。
定理1.对于任一个函数f:D→Rd,若算法A的输出结果满足下列等式,则A满足ε差分隐私:
A(D)=f(D)+<Lap1(Δf/ε),…,Lapd(Δf/ε)>
其中,Lapi(Δf/ε)(1≤i≤d)是相互独立的拉普拉斯变量,噪音量大小与Δf成正比,与ε成反比.算法A的全局敏感性越大,所需噪音越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510041710.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无线读码器
- 下一篇:一种防拷贝Soc启动方法及芯片