[发明专利]基于一致性特征的非交互式差分隐私发布模型的优化方法有效

专利信息
申请号: 201510862311.3 申请日: 2015-11-30
公开(公告)号: CN105512247B 公开(公告)日: 2019-03-08
发明(设计)人: 钱磊;宋涛;姚建国;梁阿磊;马汝辉;管海兵 申请(专利权)人: 上海交通大学
主分类号: G06F16/2458 分类号: G06F16/2458
代理公司: 上海新天专利代理有限公司 31213 代理人: 张宁展
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 一致性 特征 交互式 隐私 发布 模型 优化 方法
【说明书】:

发明提出了一种基于一致性特征的非交互式差分隐私发布模型的优化方法,其先为数据集的每个属性建立体现匿名层次的抽象树结构,作为划分原始数据集的依据;所有抽象树的根节点集合组成初始化的划分区间,把原始数据集归入其中,然后自顶向下依次不重复地选取一个属性作为划分依据,按照这个属性的抽象树结构产生下一层区间集,并划分数据集,依次类推直到事先定义的算法迭代次数,最终生成一棵构造树,并在叶节点处加拉普拉斯噪音;接着利用节点间的一致性特性,运行噪音优化算法f,使得在满足差分隐私保护的前提下,用父节点做应答的方式替代子节点组合的计算模式,大幅度减轻发布数据集对于范围查询类应用的噪音叠加问题。本发明有效的地缓解了范围计数类查询中的噪音叠加问题,并且符合差分隐私保护的定义,减少了隐私保护的代价,有效提高了发布数据在后续应用中的可用性。

技术领域

本发明涉及计算机数据挖掘、机器学习、数据隐私保护等领域。具体来讲,是一种利用数据关系间的一致性减少不必要的噪音引入,针对范围查询频繁的应用类型,提升非交互式差分隐私框架下发布数据的可用性。

背景技术

数据应用领域中的数据隐私保护问题越来越引起关注。对于数据拥有者而言,数据中所包含的隐私信息是在数据发布中特别需要注重和保护的问题。传统的保护方式虽然能保护数据的隐私信息,但是它们都是基于特殊的攻击假设和背景知识,一旦攻击者掌握了某些隐私数据的前景信息或者进行组合攻击的时候,传统的隐私保护方法就变得不那么安全可靠了。差分隐私已经成为了新的隐私保护模型,它提供了强有力的隐私保障,通过在隐私数据中添加适当的噪音达到保护的目的,而不管攻击者拥有多少的隐私数据相关的背景知识和攻击手段。

很多的算法和应用是对加噪数据的后续利用,这对于差分隐私框架在对隐私数据的处理上提出了新的要求,仅仅为了保护隐私可能会打破数据的内在联系,并且对于后续的范围查询类应用而言,与查询项成正比的噪音叠加现象会使得发布出的数据可用性大大降低。如何提升发布数据在后续分析应用的准确度成了差分隐私框架研究的一个关键。

差分隐私的形式化定义如下:

定义1:数据集D和D′,二者互相之间至多相差一条记录,即|DΔD′|≤1.给定一个随机算法δ,O为δ上任意一个可能的输出。若算法δ在数据集D和D′上的任意输出满足下列不等式,则δ满足差分隐私.

Pr[δ(D)=O]≤eε×Pr[δ(D’)=O]

其中,概率Pr[·]由算法δ的随机性控制,也表示隐私被披露的风险;隐私预算参数ε表示隐私保护程度,ε越小隐私保护程度越高.从定义1可以看出差分隐私技术限制了任意一条记录对算法δ输出结果的影响.该定义是从理论角度确保算法δ满足ε差分隐私,而要实现差分隐私保护需要噪音机制的介入。

噪音机制是实现差分隐私保护的主要技术,拉普拉斯机制与指数机制是被广泛使用的加噪机制,他们都与敏感性(Sensitive)定义密切相关.敏感性表示了修改数据集中一个条目所能发生的最大改变。

定义2.数据集D和D′,二者互相之间至多相差一条记录,即|DΔD′|≤1。对于任意一个函数:f:D→Rd,函数f的全局敏感性S(f)为:

其中,R表示所映射的实数空间,d表示函数f的查询维度,p表示度量S(f)使用的Lp距离,通常使用L1来度量.

拉普拉斯机制通过产生满足拉普拉斯分布的噪音来扰动真实输出值以实现差分隐私保护。

定理1.对于任一个函数f:D→Rd,若算法δ的输出结果满足下列等式,则δ满足ε差分隐私.

δ(D)=f(D)+<Lap1(S(f)/ε),…,Lapd(S(f)/ε)>

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510862311.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top