[发明专利]基于社区紧密度的快速社区发现方法无效
| 申请号: | 201110177772.9 | 申请日: | 2011-06-28 | 
| 公开(公告)号: | CN102779142A | 公开(公告)日: | 2012-11-14 | 
| 发明(设计)人: | 蔺智挺;吴秀龙;陈军宁;孟坚;徐超;李正平;谭守标 | 申请(专利权)人: | 安徽大学 | 
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 | 
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 | 
| 地址: | 230601 安徽省*** | 国省代码: | 安徽;34 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 基于 社区 密度 快速 发现 方法 | ||
技术领域
本发明涉及复杂网络领域,尤其涉及一种复杂网络中社区结构的发现技术及其实现方法。
背景技术
社区发现技术即发现网络中的社区结构是复杂网络中的一个基础研究,也是近年来复杂网络中的一个研究热点。
关于网络社区结构的研究,它不仅与计算机科学中的图形分割(GP:graph partition)技术密切相关,还与社会学中的层次聚类(HC:hierarchicalclustering)技术也有着不容忽视的关系。
基于图分割的著名算法主要有K-L算法、谱平分法、派系过滤算法和W-H快速谱分割法等。其中,K-L算法在稀疏图中的时间复杂度O(n3)。并且其最大缺陷是必须为算法预先指定两个社区的大小,否则算法会得到错误的划分结果,这就使该算法的应用非常的有限,在大多数的真实网络中根本无法得到应用。此外,即便克服了K-L算法的这一缺点,我们仍然不能解决K-L算法作为图分割方法的先天性不足。至于谱平分法,人们在使用这类方法时,预先不能确定究竟将图分成多少个子图才合适,因为该方法只能将图分成2个子图即偶数个子图,且不知何时停止。
而层次聚类算法可分为两大类算法:凝聚算法和分裂算法。凝聚算法的典型代表是Newman快速算法,该算法可以用于分析含有高达100万节点的复杂网络。此后,Clauset、Newman和Moore等人又提出了一种新的贪婪算法。该算法是基于Newman快速算法,并采用了数据结构“堆”来对网络的模块化度进行计算和更新,其复杂度只有O(nlog2n)。在很多不同的现实网络中,凝聚算法的确已经得到了广泛应用,但这并不能掩饰这类算法所存在的问题。首先,在一些应用中,即使已经知道了社区数目,却并没有得到正确的社区结构。其次,凝聚算法倾向于找到社区的核心,而忽略社区的周边。
而GN算法属于层次聚类中的分裂算法。尽管该算法弥补了一些传统算法的不足,但是仍然存在一个缺陷:不能直接根据网络的拓扑结构来判断它所求的社区是否有意义。另外,GN算法在对社区数目不清楚的情况下,也不知道算法该在哪一次迭代后结束。
由以上描述可以看出,现有的社区发现技术性能虽然优越,也可以较为准确地发现复杂网络中的社区结构,但是它们的计算量却依然十分庞大,严重限制了它们在大型复杂网络中的应用。
发明内容
有鉴于此,本发明的主要目的在于提供一种新的社区发现技术——基于社区紧密度的快速社区发现方法,在不影响社区发现性能的情况下,降低方法所需的时间复杂度,使其可以更好地应用在大型的复杂网络中。
为了达到上述目的,本发明引入了边稠密度、相邻社区的概念,并设计了一种紧密度矩阵。
其中边稠密度的定义如下:给定一个含有n个顶点,m条边的图G,该图的边稠密度是边数目与顶点数目的比率,数学描述为λG=m/n。
其中相邻社区的定义如下:给定一个当前具有k个社区的图G和相应的紧密度矩阵M,我们称满足如下条件的社区i和社区j是相邻的,它们互为相邻社区:mij≥[λG/2],i∈[1,k],j∈[1,k]。
其中我们设计的紧密度矩阵如下:给定一个含有n个节点、m条边的图G,该紧密度矩阵的公式描述为M=(mij)k×k,其中M代表紧密度矩阵,mij代表社区i和社区j之间的紧密度值,k是当前网络中的社区个数,其值小于等于n。
其中紧密度矩阵中的元素记录的是任意两个社区之间的紧密度值。并且紧密度矩阵M在初始化时,其每个元素的紧密度值均置为0,这紧密度值会随着算法的运行逐渐增大。
实现本发明所提供的社区发现技术包含三部分的工作:
A、计算紧密度矩阵;
B、合并社区;
C、更新紧密度矩阵。
其中步骤A是我们最先需要完成的工作,即我们需要首先计算出网络中的紧密度矩阵。然后才能开始步骤B合并社区的工作,步骤B完成后,需要对步骤A中计算出的紧密度矩阵按照步骤B的结果进行更新,然后再进行下一轮的迭代。
其中步骤A的工作包括两种情况:
A1、计算无权网中的紧密度矩阵;
A2、计算加权网中的紧密度矩阵。
其中步骤B,紧密度矩阵M的维数k初始值等于所研究的图中顶点的个数(初始时,每个顶点形成该图中的一个独立社区,即此时每个社区内只有一个节点)。并且步骤B中,合并社区的工作有两种特殊情况:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110177772.9/2.html,转载请声明来源钻瓜专利网。





