[发明专利]一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法在审
申请号: | 202011013025.7 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112131603A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 金媛媛;刘胜军;谢飞;倪志伟;卜凡耀;陈千;朱旭辉;周芳;倪丽萍 | 申请(专利权)人: | 合肥城市云数据中心股份有限公司;合肥工业大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 合肥国和专利代理事务所(普通合伙) 34131 | 代理人: | 张祥骞 |
地址: | 230031 安徽省合肥市高新区玉*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 四叉树 自适应 划分 技术 二维 空间 数据 隐私 发布 方法 | ||
1.一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法,其特征在于,包括以下步骤:
11)二维空间数据的获取,获取待进行隐私发布的二维空间数据;
12)网格区域的划分:对二维空间数据进行聚类,将二维空间数据根据密度聚类形成自适应网格,将数据空间划分为不同密度的区域;
13)自适应网格区域的划分处理:对自适应网格区域中数据分布最为稀疏的区域计数根据隐私预算直接添加噪音;对剩余密度区域作为密集区域采用四叉树分割数据空间,将粗粒度区域进一步划分为均匀细粒度区块,以降低区域内的均匀假设误差;
14)对四叉树进行后置处理:对于纵向结构,采用重构算法自底向上改进四叉树,有效减小均匀假设误差;对于横向结构,结合抽样排序和贪心算法,将四叉树划分结果分层合并,有效减小长范围区间查询的误差累计;
15)二维空间数据差分隐私的发布:对密集区域添加噪音分配隐私预算:将四叉树与个性化分配隐私预算相结合,根据需求个性化调整相邻两层分配的隐私预算;对四叉树分层添加噪音后融合已添加噪声的稀疏区域后对外发布数据。
2.根据权利要求1所述的一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法的二维空间数据差分隐私发布方法,其特征在于,所述网格区域的划分包括以下步骤:
21)根据待发布的二维数据集合L,创建两个集合:一个只包含所有横坐标位置记为Lx,另一个只包含所有纵坐标位置记为LY;
22)定义横坐标和纵坐标的区间长度Δx和Δy,分别根据Lx、LY计算区间的密度,对区间进行密度判定,密度相似的临近区间进行聚类,形成横坐标和纵坐标的稠密区间和稀疏区间;
23)根据区间划分结果,对二维数据集合L进行密度自适应网格划分,得到粗粒度区块,得到不同密度的区域。
3.根据权利要求1所述的一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法的二维空间数据差分隐私发布方法,其特征在于,所述自适应网格区域划分处理包括以下步骤:
31)对于位于稀疏区域的第一层区块,不再划分,直接对其原始计数结果添加隐私预算为ε的Laplace噪声;
32)已经进行网格划分的数据集,根据第一层网格的划分结果,对于横轴和纵轴都处于密集区域的区块,将区块定义为一个根节点,进行四叉树划分;
33)对密集区块的数据进行初始化分割,建立完整的满四叉树,将所有的二维数据存储于相应四叉树节点中。
4.根据权利要求1所述的一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法的二维空间数据差分隐私发布方法,其特征在于,所述对四叉树进行后置处理包括以下步骤:
41)自底向上的对处于同一父节点下的叶子节点的计数值求均值,使用(1)式计算四叉树向上重构后这部分区域加噪后的误差Err;
其中,Y是规定的隐私预算下的平均噪音,numi是四个叶子节点的真实计数值,i是同一父节点下四个叶子节点的编号;
42)通过比较Err与原始节点计数直接加噪后的误差大小,来启发式地判断父节点区域是否均匀,如果直接加噪的节点误差比重构后节点的误差大,则将节点向上缩减重构来减小误差;
43)分别对四叉树各层节点进行抽样排序,抽样排序所需隐私预算为ε1;
44)排序后,采用指数机制每次以正比于的概率选择某层节点中最相似的两个邻近节点进行合并,
其中,ε2为合并相似节点所设置的隐私预算,ε3为第i层节点添加拉普拉斯噪音的隐私预算,Gs为误差最小的n个可行合并方案集合;
45)采用贪心的思想对其进行合并加噪,利用(2)式计算总误差Error,直到总误差达到最小,
Error=RE+NE,(2)
其中,RE为合并误差,NE为噪音误差。
5.据权利要求1所述的一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法的二维空间数据差分隐私发布方法,其特征在于,所述对密集区域添加噪音分配隐私预算包括以下步骤:
51)获取四叉树的深度h,定义相邻两层分配的隐私预算比值q(q1),根据总添加拉普拉斯噪音隐私预算ε3以及qi,给四叉树的第i层分配不同的隐私预算其中各层隐私预算满足条件
52)按照所分配的隐私预算对四叉树各层节点计数添加拉普拉斯噪音发布四叉树各层区域的噪音计数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥城市云数据中心股份有限公司;合肥工业大学,未经合肥城市云数据中心股份有限公司;合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011013025.7/1.html,转载请声明来源钻瓜专利网。