[发明专利]集值数据和社会网络数据联合发布的多源隐私保护方法有效
申请号: | 201710026184.2 | 申请日: | 2017-01-13 |
公开(公告)号: | CN106778352B | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 李先贤;林汕;刘鹏;王如希 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 陈跃琳 |
地址: | 541004 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 社会 网络 联合 发布 隐私 保护 方法 | ||
本发明公开一种集值数据和社会网络数据联合发布的多源隐私保护方法,针对利用社交网络数据的度和集值数据的非敏感值进行攻击,首先在集值数据上进行分组泛化,要求每个组内满足隐私要求即可,避免全局泛化过度,然后在集值数据分组泛化的基础上,对应的社交网络数据进行组内匿名,在匿名之前先对社交网络数据进行社区检查,匿名时候尽量在社区内部扰动,这样避免匿名时候对社区改变过大。本发明能够适用于多源数据的同时发布。
技术领域
本发明涉及数据隐私发布技术领域,具体涉及一种集值数据和社会网络数据联合发布的多源隐私保护方法。
背景技术
随着互联网的飞速发展,人们在网上进行各种各样的活动,随之产生了社交网络数据和集值数据。例如在QQ、微信、Facebook等社交应用上进行交友、联系朋友同事等,在亚马孙、淘宝、京东等电商平台上进行购物行为。为了更深入挖掘这些数据的价值,数据挖掘者和数据分析人员会对数据进行分析。然而,这些社会网络数据和集值数据直接发布会泄露用户信息,这给用户带来潜在的危害。
目前,在社交网络数据和集值数据的隐私保护中各自都有一些研究,大概有以下几方面:
对于集值数据的隐私保护,最初采用的是简单匿名方法,也就是抑制或泛化能唯一确定用户的标识符,如姓名、ID号等,这样简单匿名使得攻击者无法直观定位用户。接着在简单匿名的基础上,依赖泛化层次树,提出了k匿名,使得数据集中的每一条记录出现次数都不少于k。之后借鉴k匿名思想,研究发展出km匿名,也就是对于任意m个项目集,数据集中至少包含k条记录,称之满足km匿名。除此之外,还有(k,l)(m,n)匿名、p不确定模型、(h,k,p)coherence模型等集值数据的隐私保护方法。
而社交网络数据中,节点表示用户,边表示用户之间有关系。网络的敏感信息是多样化的,比如边识别,节点识别,属性泄露等都是潜在性敏感的,不同的敏感信息和不同泄露攻击方法,也对应着不同的隐私保护方法。其中,最简单也最常见的匿名方法是简单匿名,也就是移除或用数字或字母序号代替能唯一确定用户的属性。在简单匿名的基础上,节点k匿名方法把结构相似或距离相近的k个节点聚成超级节点,超级节点的边也概化成超级边,由于超级节点内部节点不可以区分,节点被识别的概率小于1/k。除此之外,类似还有子图k匿名、k度匿名、随机化、差分隐私等隐私保护方法。
然而,这些保护模型都是针对单一数据,随着科技的发展,为了更好挖掘信息,发布多源数据是很有必要的。但多源数据同时发布时,原来的保护模型已不适用。
发明内容
本发明所要解决的技术问题是现有保护模型都是针对单一数据,难以适用于多源数据同时分布的问题,提供一种集值数据和社会网络数据联合发布的多源隐私保护方法。
为解决上述问题,本发明是通过以下技术方案实现的:
集值数据和社会网络数据联合发布的多源隐私保护方法,包括如下步骤:
步骤1、去掉集值数据和社会网络数据的标识符,并对社会网络数据进行进行社区检查,得到社区划分;
步骤2、对于根据集值数据的非敏感值,构建一个泛化树;并根据泛化树对集值数据进行分组,使得每个组内的数据集都满足隐私要求;
步骤3、先将社会网络数据节点与集值数据ID对应,根据步骤2所得的集值数据的分组,对社交网络数据的节点进行对应分组;再对社交网络数据进行组内匿名处理。
步骤1中,采用GN算法对社会网络数据进行进行社区检查。
步骤2的具体步骤为:
步骤2.1、根据集值数据的非敏感值制定泛化树,并构造分组层次树,将所有非敏感值泛化到最高层次,敏感值则不做任何操作;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710026184.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及数据处理装置
- 下一篇:用于保存消息的方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置