[发明专利]基于李雅普诺夫优化对无限数据流差分隐私保护的方法在审
申请号: | 201910304859.4 | 申请日: | 2019-04-16 |
公开(公告)号: | CN110378142A | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 杨树森;王舒阳;惠永昌 | 申请(专利权)人: | 江苏慧中数据科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 224000 江苏省盐城市城南新*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 隐私保护 无限数据 数据变化 优化 算法 输出 动态优化 滑动窗口 模型基础 实际数据 数据误差 应用效果 扰动 预算 噪声 隐私 场景 消耗 替代 | ||
1.基于李雅普诺夫优化对无限数据流差分隐私保护的方法,其特征在于,包括以下步骤:
步骤1,保护无限数据流,每隔一段时间发布一次数据,时间越长,发布的数据越多,主要的保护对象是数值型数据,且全局敏感度Δf=1,将无线数据流建模为S=(c(1),...,c(i-1)),c(i)为在时间节点i上,数据的真实值,经算法运算后系统输出为O=(o(1),...,o(i-1)),o(i)为在时间节点i上,数据的真实值;
确定非空输出:从输出值[o(1),...,o(i-1)]中找出i之前时刻最后一个分配隐私保护预算进行扰动保护的非空输出ol;
步骤2,计算差值:计算最后一个非空输出ol与当前i时刻真实值c(i)的差值dis,使用绝对误差作为衡量差值的标准,即dis=|ol-c(i)|;
步骤3,对差值dis加入拉普拉斯噪声进行保护;
步骤4,分配合适的隐私保护预算:结合滑动窗口平均隐私预算消耗的隐私保护模型和李雅普诺夫优化方法,进行合理的隐私预算分配,当数据变化较小时,不分配隐私保护预算,当数据变化较大时,分配隐私预算对当前值进行差分隐私保护;
步骤5,判断数据的变化情况:根据数据变化趋势,选择替代或扰动操作,若数据变化较小,输出上一时刻的值进行替代操作,若数据变化较大,输出此刻真实值加入拉普拉斯噪声进行扰动操作。
2.根据权利要求1所述的基于李雅普诺夫优化对无限数据流差分隐私保护的方法,其特征在于,步骤3的具体操作为:c(i)是当前时刻的真实值,ol是i之前时刻最后一个分配隐私保护预算进行扰动保护的非空输出,计算最后一个非空输出与当前i时刻真实值的差值dis,使用绝对误差作为衡量差值的标准,为了防止攻击者通过获取dis的具体值来推断相邻时刻的具体信息,针对窗口w中的每一个时间节点的dis分配εi,1=εβ/w的隐私保护预算,这部分隐私保护预算是固定的,接着为dis加入值为λi,1=w/εβ的拉普拉斯噪声,β是预算分配比例。
3.根据权利要求1所述的基于李雅普诺夫优化对无限数据流差分隐私保护的方法,其特征在于,步骤4的具体操作为:在信息会实时发布的系统中,每隔一段时间,系统会发布新的数据,需要保护的数据是在不断增加的,面对不断增加的数据,采用滑动窗口对其进行保护,窗口的大小为w,针对当前的时间节点i,窗口内包含时间节点i-w+1到i的w个数据,每个窗口内分配固定的隐私保护预算ε,原有滑动窗口的差分隐私模型定义较强,每个窗口内分配的隐私保护预算必须严格的小于之前所设定的ε,但是在无限数据流中,每一段窗口的数据情况存在差异,较强的隐私模型会造成发布数据效用性较低,所以提出了平均w-event法,即所有窗口内分到保护预算的平均值要小于ε,结合李雅普诺夫优化目标优化函数如下所示:
式中,ol是i之前时刻最后一个分配隐私保护预算进行扰动保护的非空输出,c(i)是当前时刻的真实值,εi,2是分配给i时间节点上进行当前时刻数据保护的隐私保护预算,λi,2=1/εi,2是用来衡量数据是否发生剧烈变化的参照,
限制函数如下所示:
式中,εk,2是k时刻进行数据保护的隐私预算,β是预算分配比例系数
维持函数平衡的虚拟队列Q(i)需要不断更新,更新公式如下所示:
Q(i+1)=max[Q(i)+Y(i),0]
找出一个εi,2,使得VP(i)+Q(i)Y(i)最小,
式中,εi,2是分配给i时间节点上进行当前时刻数据保护的隐私保护预算,λi,2=1/εi,2是用来衡量数据是否发生剧烈变化的参照,V是一个非负权重,用来平衡算法性能。
4.根据权利要求1所述的基于李雅普诺夫优化对无限数据流差分隐私保护的方法,其特征在于,步骤5的具体操作为:如果dis小于λi,2,则表示上一个非空输出值与当前真实值差异较小,数据变化平缓,可以不对当前时刻i再额外分配隐私保护预算,直接输出非空输出的值,简单的来说就是使用非空输出值代替了当前的输出值ol,o(i)是i时刻的输出值,o(i)=null,Output(i)=o(i),如果dis大于λi,2,则表示上一个非空输出值与当前真实值差异较大,不能进行替代操作,需要对当前时刻的真实值分配隐私保护预算εi,2,o(i)=c(i)+Lap[λi,2],Output(i)=ol,
式中,c(i)是i时刻的真实值,λi,2=1/εi,2是用来衡量数据是否发生剧烈变化的参照,Output(i)是方法在i时刻的输出值,ol是i之前时刻最后一个分配隐私保护预算进行扰动保护的非空输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏慧中数据科技有限公司,未经江苏慧中数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910304859.4/1.html,转载请声明来源钻瓜专利网。