[发明专利]一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法在审
申请号: | 202011013025.7 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112131603A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 金媛媛;刘胜军;谢飞;倪志伟;卜凡耀;陈千;朱旭辉;周芳;倪丽萍 | 申请(专利权)人: | 合肥城市云数据中心股份有限公司;合肥工业大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 合肥国和专利代理事务所(普通合伙) 34131 | 代理人: | 张祥骞 |
地址: | 230031 安徽省合肥市高新区玉*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 四叉树 自适应 划分 技术 二维 空间 数据 隐私 发布 方法 | ||
本发明涉及一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法,与现有技术相比解决了难以高效划分复杂分布数据空间、数据可用性差的缺陷。本发明包括以下步骤:二维空间数据的获取;网格区域的划分;自适应网格区域的划分处理;对四叉树进行后置处理;差分隐私二维空间数据的发布。本发明能够有效的划分各种复杂分布形式的二维空间数据集,降低数据的长范围查询误差,实现二维空间数据的差分隐私有效发布。
技术领域
本发明涉及数据隐私发布技术领域,具体来说是一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法。
背景技术
近年来,移动社交网络、车联网等许多实际热门应用产生了大量二维空间数据,使得二维空间数据及其统计数据的采集和使用越来越便捷。随着信息技术的发展,需要将大量的用户数据进行发布,为数据挖掘、分析处理等工作提供支持,然而这些数据的直接发布会给个人隐私造成威胁,用户的隐私保护问题亟需得到保护。
针对这一问题,传统基于K匿名的隐私保护技术需要对攻击者的能力和背景知识进行假设估计,在实际应用中存在一定局限性。目前,差分隐私技术作为一种新出现的隐私保护框架,通过对发布数据进行随机扰动,能够为防止攻击者在任意背景知识下的攻击提供有力保护,在数据安全发布领域得到了广泛应用。然而二维空间大数据尤为庞大,实际生活中的大数据随着区域不同,其分布变化多样,与差分隐私模型相结合后长范围查询误差累积问题严重,所带来的噪音误差造成了数据的可用性降低,因此,在二维空间数据发布时如何平衡数据的隐私安全和数据的可用性,是当前隐私保护技术的一个主要目的。
对于二维空间统计数据的发布,通常需要将数据集进行划分,其中常用的有基于网格结构和树结构的划分方法。在网格划分方法中,均匀网格划分算法(见文献Qardaji W,Yang W,Li N.Differentially Private Grids for Geospatial Data[C]//2013 IEEE29th International Conference on Data Engineering(ICDE).IEEE,2013:757-758)对二维空间数据均匀的划分为等宽的单元格,为每个单元格计数添加拉普拉斯噪音,没有考虑到数据分布的不均匀性;自适应划分策略(见文献Qardaji W,Yang W,LiN.Differentially Private Grids for Geospatial Data[C]//2013 IEEE 29thInternational Conference on Data Engineering(ICDE).IEEE,2013:757-758)先以α·ε(0α1)的隐私预算使用均匀网格进行粗粒度划分,再根据网格的密度以(1-α)·ε的隐私预算进行第二次自适应网格划分,其考虑到数据分布的密度,但是没有给出启发式规则来区分数据稠密和稀疏的边界。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥城市云数据中心股份有限公司;合肥工业大学,未经合肥城市云数据中心股份有限公司;合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011013025.7/2.html,转载请声明来源钻瓜专利网。