[发明专利]一种面向大规模图数据发布的隐私保护方法及系统有效
申请号: | 201711050486.X | 申请日: | 2017-10-31 |
公开(公告)号: | CN107742083B | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 丁晓锋;金海;王摧 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 大规模 数据 发布 隐私 保护 方法 系统 | ||
本发明公开了一种面向大规模图数据发布的隐私保护方法,具体为(1)将原图数据均匀地划分多个子块;(2)读取被切割连边,比较被切割连边两端的节点度大小,在节点度较大的节点所属子块内新增噪声节点,通过节点度较大的节点与噪声节点连线实现对被切割连边的保留;(3)构造出同构块矩阵;将子块结构信息与同构块矩阵比较,并以添加噪声边的方式进行同构,完成图数据匿名保护。本发明将整体的图数据匿名保护所需时间降低了一个数量级,做到了匿名化过程的高效性;最终的匿名图满足k匿名机制,做到了匿名化的安全性。该发明保证了匿名图在可用性,安全性,高效性三者的平衡性能大幅度提升。
技术领域
本发明属于图数据处理技术领域,更具体地,涉及一种面向大规模图数据发布的隐私保护方法及系统。
背景技术
近年来,随着多方共享数据规模的爆炸式增长,无论是学术界或是工业界,都迫切需要大规模数据处理技术,尤其是对于像大规模图数据的这类非结构化数据。由于图数据的结构特性,其在众多数据存储分析领域得到广泛运用。例如Facebook采用TAO系统存储其超大规模的社会网络数据。然而像这类的社会网络数据包含了大量的用户个人隐私信息,数据拥有者在发布和分享这些数据给第三方之前需要对原数据进行特殊的隐私保护处理。通常说来,简单地将原图数据去除用户ID来保护隐私,攻击者仍旧能够基于已知的背景知识轻易地识别出图数据上的个体,并且获取其相关的隐私信息。而这类重识别攻击风险可大致划分为三类:1、身份泄露风险:个体能够通过其对应的邻居节点信息被唯一识别;2、成员泄露风险:各个成员间的关联信息泄露;3、内容泄露风险:个体敏感属性或者个体间连接的敏感信息泄露。因此,保护图数据上的隐私信息至关重要。
目前,针对图数据的隐私保护主要方式之一是k匿名机制。k匿名机制其目的在于确保图上个体被识别出来概率最大为1/k,匿名图的可用性以及其安全性二者的平衡依赖于k值的大小。而k匿名的突出优势在于其允许数据拥有者修改原图上的结构信息并且发布整个匿名后的图结构信息给任意的第三方。但现有基于k匿名机制的隐私保护方案存在有以下突出问题:1、效率低,匿名化周期长:由于现有技术花费大量的时间在图分割过程中,使得匿名方案整体效率性大幅度下降;2、可用性差:现有技术可用性受制于图分割的优劣,由于图分割的不确定性,往往匿名过程需要添加大量的噪声信息以及删除原图上的信息,使得匿名图的可用性随机性大,可用性差;3、平衡性差:现有匿名方案往往着重于方案的可用性或高效性上,缺乏对于可用性、高效性以及安全性三者间动态平衡的保障。
发明内容
针对现有技术的缺陷,本发明提供一种面向大规模图数据发布的隐私保护方法及系统,其目的在于,将整体的图数据匿名保护所需时间大幅度降低,做到了匿名化过程的高效性;最终的匿名图满足k匿名机制,做到了匿名化的安全性。该发明保证了匿名图在可用性、安全性、高效性三者的平衡性能大幅度提升。
为了实现上述目的,本发明提供了一种面向大规模图数据的隐私保护方法,所述包括以下步骤:
一种面向大规模图数据发布的隐私保护方法,所述方法包括以下步骤:
(1)图分割步骤:将原图数据均匀地划分为k个子块,记录子块间由于块划分导致的被切割连边信息;
(2)连边保留步骤:读取被切割连边,比较被切割连边两端的节点度大小,在节点度较大的节点所属子块内新增噪声节点,通过节点度较大的节点与噪声节点连线实现对被切割连边的保留;
(3)子块同构步骤:聚合k个子块的结构信息,构造出同构块矩阵T;将k个子块结构信息分别与同构块矩阵T比较,并以添加噪声边的方式进行同构,使得同构后的k个子块的邻接矩阵与矩阵T相等,完成图数据匿名保护。
进一步地,所述步骤(3)中构造同构块矩阵T的具体实施方式为:
(3-1)统计各k个子块包含的最多节点数,记为max;
(3-2)分别在各k个子块内,将各节点按照节点度升序排列构成节点序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711050486.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置