[发明专利]一种对匿名图数据进行演化分析的方法有效
申请号: | 201310331668.X | 申请日: | 2013-08-01 |
公开(公告)号: | CN103440263A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 丁旋;刘云浩;孙家广 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 匿名 数据 进行 演化 分析 方法 | ||
技术领域
本发明涉及图数据挖掘与分析技术领域,尤其涉及一种对匿名图数据进行演化分析的方法。
背景技术
图是计算机科学中最常用的一类抽象数据结构,在结构和语义方面比线性表和树更为复杂,更具有一般性表示能力。现实世界中的许多应用场景都需要用图结构表示,与图相关的处理和应用几乎无所不在。以我们身在其中的社会网络为例,它是一种典型的以图为基本结构的数据。社交网络体现了朋友之间的社交联系,这种社交联系的复杂性随人类历史进程所发生的各种技术进步不断增加,包括便利人们长途旅行的交通技术、全球通信技术以及数字化交流与互动技术,等等。
近年来,关于大规模图数据的研究呈爆炸性增长,主要得益于人们可以得到越来越多的大规模图数据,尤其是社会网络数据。Internet技术、大容量存储技术的迅猛发展以及数据共享范围的逐步扩大使得数据的自动收集和发布越来越方便。在数据发布过程中隐私泄露问题也日益突出,因此隐私保护问题就显得尤为重要。数据发布中隐私保护对象主要是对用户敏感数据与个体身份之间的对应关系。一般通过删除标识符的方法发布数据是无法阻止隐私泄露的,攻击者可以通过链接攻击获取个体的隐私数据。匿名化技术可有效地解决链接攻击所带来的隐私泄露问题。自从1998年Samarati等人首次提出匿名化概念以来,国内外专家学者们对匿名化技术开展了广泛深入的研究工作以寻求防止或减少隐私泄露的有效方法,取得了一系列相关研究成果。匿名化技术由于能够在数据发布环境下防止用户敏感数据被泄露,同时又能保证发布数据的真实性,在实际应用领域受到广泛关注。
然而,目前针对图数据的匿名化技术研究仅关注单次发布的静态数据,对动态更新、连续发布的图数据的匿名化技术研究非常不足。由此引发的一大问题是数据分析师仅能够对匿名化后的图数据进行静态分析,而无法对采用匿名化技术发布的同一图数据源在不同时间点的多个快照进行演化分析。图数据的演化分析涉及了图论、概率论、生物数学的相关内容,主要研究图数据的拓扑结构如何作用于群体的进化演变,是图数据挖掘与分析领域的一大重要课题。现有的匿名化技术由于破坏了图数据中的标识信息,割裂了快照之间的联系,使得演化分析无法进行。
发明内容
(一)要解决的技术问题
针对现有技术的不足,本发明所要解决的技术问题是:如何提供一种对匿名图数据进行演化分析的方法,能够对采用匿名化技术发布的同一图数据源在不同时间点的多个快照进行演化分析。
(二)技术方案
为了解决上述技术问题,本发明提供了一种对匿名图数据进行演化分析的方法,包括如下步骤:
A、建立匿名图数据各个快照的核心节点之间的映射,关联所有映射,得到匿名图数据的核贯穿集;
B、利用节点匹配算法,对上述核贯穿集以外的各个快照的其他节点进行匹配,关联能匹配的节点,将核贯穿集扩展为全贯穿集;
所述贯穿是指匿名图数据的各个快照中所有指代相同对象的节点按快照的时间顺序串成的节点链;所述核贯穿是指由匿名图数据各个快照的核心节点组成的贯穿。
具体地,所述步骤A具体包括如下步骤:
A1、对匿名图数据进行挖掘,得到每个快照的k个核心节点,k为大于1的整数;
A2、以上述快照的核心节点为节点建立各个快照的导出子图;
A3、将上述各个导出子图转换为对应的带权完全图;
A4、按照快照的时间顺序,依次建立每个带权完全图到下一带权完全图节点之间的一一映射,其中最后一个带权完全图的节点映射到第一个带权完全图的节点;
A5、关联所有映射,得到核贯穿集。
进一步地,所述步骤A1具体为:
对每个快照,按照节点的核心程度从大到小进行排序,排序结果的前k个节点即为该快照的核心节点。
优选地,所述核心程度是以节点的度来衡量的,节点的度越大,则其核心程度越高。
进一步地,所述步骤A3具体为:
以所述导出子图的顶点为顶点构造带权完全图,使任意两顶点之间都有一条边相连,优选地,边上的权重为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310331668.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:与一个可移动的远程机器人相互交流
- 下一篇:船舶用发电系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置