[发明专利]一种社交网络重叠社区发现系统及其方法有效
申请号: | 201410436259.0 | 申请日: | 2014-08-29 |
公开(公告)号: | CN104166731B | 公开(公告)日: | 2017-11-17 |
发明(设计)人: | 张卓;游煌斌;张学武;范新南;李敏;付怀勇 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京纵横知识产权代理有限公司32224 | 代理人: | 董建林,耿英 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 重叠 社区 发现 系统 及其 方法 | ||
技术领域
本发明涉及数据挖掘和复杂网络研究领域,尤其涉及一种社交网络重叠社区发现系统及其方法。
背景技术
现实世界中存在的许多复杂系统大多可以用复杂网络进行描述。例如:新陈代谢网,蛋白质交互网,基因网络,科学家合著网络,电力网,航空网以及社交网络等等。一直以来人们对于复杂网络的研究从未间断,近些年来,由于互联网的快速发展使得人们越来越关注复杂网络,尤其是社交网络,并进行了大量的研究工作。
一般而言,复杂网络由于自身内部结构较为复杂,直接对整个网络进行研究是一件十分困难的事,因此人们一般通过研究网络的社区结构从而更好地理解整个网络。所谓社区,是节点的集合,在社区内部节点连接很紧密,但是属于不同社区的节点连接则比较稀疏。社区结构普遍存在于复杂网络中,社交网络作为复杂网络的一类也已被证明网络内部具有社区结构,很多用于复杂网络的社区发现算法也可用于社交网络。
当前,对于网络社区结构发现的研究已经有不少成果,提出了众多社区发现方法。早期的研究主要集中于非重叠社区发现,即认为单个节点只能属于一个社区。典型的方法有Kernighan-Lin方法、基于Laplace矩阵的谱平分法以及Newman等人提出的FastNewman方法和CNM方法,其中CNM方法还是时间复杂度最低的算法之一。但是后来人们研究发现实际生活中社区有可能是重叠的,即一个节点有可能同时属于多个社区。例如在社交网络中一个人可能同时参加多个讨论小组。最早的重叠社区方法是Palla等人提出的K-clique派系过滤算法,它将相邻的K-clique进行合并,而属于多个K-clique的节点便构成了网络中社区的重叠部分。该方法可有效的检测出网络中的社区,然而该方法需提前告知网络社区的数目,而实际网络往往不知道最终的社区数目,这使得该方法的使用受到限制。网络重叠社区的发现对于深入了解网络的结构特征具有重要的意义,从而提供更有效、更具个性化的服务。社交网络由于数据量较大,因此要求社区发现方法的时间复杂度尽可能低的同时也具有较高的划分准确度。而现有的不少方法往往时间复杂度低却难以保证划分准确度,具有较高的划分准确度的方法时间复杂度也很高。
发明内容
技术问题:本发明的目的在于提供一种社交网络重叠社区发现系统及其方法,解决现有技术对重叠社区发现准确率和时间复杂度难以兼顾的问题。
技术方案:本发明提出一种可用于社交网络的重叠社区发现系统,包括数据采集模块、网络转换模块、非重叠社区获取模块、重叠社区获取模块以及显示模块。其中数据采集模块主要实现对实际网络数据的采集;网络转换模块实现对采集数据的转换,以邻接矩阵的形式存储原始网络信息;非重叠社区获取模块则采用非重叠社区发现方法对网络进行处理,初始时认为单个节点代表一个社区,然后每次合并使模块度增量最大的两个社区,反复迭代直到模块度为最大值,从而得到非重叠社区;重叠社区获取模块通过计算社区中节点与其他社区的隶属度,判断是否应将该节点加入对应社区,从而可以得到重叠节点,同时发现重叠社区;显示模块主要将最终获取的重叠社区以网络节点图的形式直观地展示。
本发明还提出了一种可用于社交网络的重叠社区发现方法,首先将采集实际网络数据,然后采用非重叠社区发现方法找出网络中的非重叠社区,最后在非重叠社区的基础上找出其中的重叠节点,从而得到重叠社区。
为实现上述目的,本发明技术方案包括如下步骤:
步骤一、采集实际网络数据,以邻接矩阵的形式存储原始网络信息。
步骤二、采用非重叠社区发现方法对网络进行处理,得到非重叠社区。
(一)将单个节点视为一个社区,同时进行变量初始化设置。
(二)计算任意两个社区合并之后的模块度增量ΔQ。
(三)重复第二步直到模块度Q达到最大值,此时认为社区划分达到最优化,算法结束。
步骤三、通过计算社区中节点与其他社区的隶属度,判断是否应将该节点加入对应社区,从而可以得到重叠节点,也发现网络中的重叠社区并将其展示。
一种社交网络重叠社区发现系统,其特征在于,包括数据采集模块、网络转换模块、非重叠社区获取模块和重叠社区获取模块;
由数据采集模块实现对实际网络数据的采集;
网络转换模块对采集的数据进行转换,以邻接矩阵的形式存储原始网络信息;
非重叠社区获取模块采用非重叠社区发现方法对网络进行处理,初始时认为单个节点代表一个社区,然后每次合并使模块度增量最大的两个社区,反复迭代直到模块度为最大值,从而得到非重叠社区;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410436259.0/2.html,转载请声明来源钻瓜专利网。