[发明专利]一种融合拓扑势和谱聚类的社区发现方法及系统有效
| 申请号: | 201410129865.8 | 申请日: | 2014-04-01 |
| 公开(公告)号: | CN103888541B | 公开(公告)日: | 2017-02-08 |
| 发明(设计)人: | 王志晓;陈昭彤;赵亚;陈少达 | 申请(专利权)人: | 中国矿业大学 |
| 主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F17/30 |
| 代理公司: | 上海光华专利事务所31219 | 代理人: | 徐秋平 |
| 地址: | 22111*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融合 拓扑 谱聚类 社区 发现 方法 系统 | ||
技术领域
本发明属于网络识别技术领域,涉及一种网络社区发现方法,特别是涉及一种融合拓扑势和谱聚类的社区发现方法及系统。
背景技术
复杂网络呈现社区结构,同一社区内的节点连接紧密,不同社区内的节点连接稀疏。社区发现是复杂网络的一项重要研究内容,对于分析复杂网络的拓扑结构,理解复杂系统的功能,发现复杂网络中的隐藏规律、演化趋势以及预测复杂网络的行为都具有重要的意义。复杂网络的社区特性能够应用到实际生活的很多方面;例如,万维网中,用于搜索引擎的优化改进;社交网站中,用于用户之间的联络预测;商务网站中,用于对会员以及潜在用户感兴趣的广告投放;生物工程上,用于对机体蛋白质群的功能性质划分等等。
目前已存在多种复杂网络社区发现方法,这些方法或采用分裂思想,或采用凝聚思想进行社区划分。谱聚类是这些方法中的一个重要分支,其通过分析一个与复杂网络节点相关的矩阵的特征向量和特征值来得到社区划分结果。谱聚类方法具有很多优点,如,仅与数据点的数目有关,而与数据对象的维数无关,可以避免由于特征向量的过高维数所造成的奇异性问题。另外,谱聚类不对数据的全局结构作假设,可以避免“局部最优”的问题。
谱聚类采用的节点矩阵主要有两大类,分别是Laplace矩阵和Normal矩阵。Laplace矩阵的表达式为L=K-A,Normal矩阵是Laplace矩阵的变体,其表达式为L=K-1A,K为对角矩阵,对角线上的元素为对应的各个节点的度,A为复杂网络的邻接矩阵。上述节点矩阵都是基于节点度和节点邻接关系构造,只能从局部反映节点与直接相连的邻居节点间的紧密关系,无法包含复杂网络节点间更多的结构信息,这在一定程度上会影响到最终社区划分结果的准确性。尽管有研究者提出了SNN(Shared Nearest Neighbor Clustering,共享最近邻)相似度矩阵或其它Laplace变体矩阵,但仍然无法从本质上脱离节点度(节点度是指和该节点相关联的边的条数)等信息,收到的效果有限。
另外,在基于Laplace矩阵进行社区发现时,无法知道目标复杂网络能够划分为多少个社区,需要事先人为设置划分数目。Normal矩阵在一定程度上解决了该问题:Normal矩阵是半正定矩阵,存在t-1个与其最大特征值1相近的非平凡特征值(非平凡特征值是值不为1的特征值),且这t-1个特征值所对应的特征向量的元素呈现阶梯分布,为社区划分提供了数目依据,阶梯数即为社区数目t。但是,当网络的社区结构不明显时,Normal矩阵的这t-1个特征向量就不会呈现十分明显的阶梯状,而是接近一条连续曲线,此时无法通过阶梯数目判断该复杂网络应划分的社区数目。
综上所述,现有基于谱聚类的复杂网络社区发现方法存在以下不足:(1)当前谱聚类中使用的节点矩阵多是基于节点度构造,无法包含复杂网络节点间更多的结构信息,在一定程度上会影响到最终社区划分结果的准确性;(2)当网络的社区结构不明显时,无法通过Normal矩阵特征向量的阶梯数目判断该复杂网络应划分的社区数目。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种融合拓扑势和谱聚类的社区发现方法及系统,用于解决现有基于谱聚类的社区划分方法中节点矩阵无法包含复杂网络节点间更多的结构信息从而影响划分结果准确性,以及在社区结构不明显时无法判断划分社区的数目的问题。
为实现上述目的及其他相关目的,本发明提供一种融合拓扑势和谱聚类的社区发现方法,所述融合拓扑势和谱聚类的社区发现方法包括:计算给定的复杂网络中n个节点的拓扑势值,根据所述n个节点的拓扑势值构造复杂网络节点的标准矩阵;n为所述复杂网络中全部节点的总数;在所述n个节点的拓扑势值中搜索所有局部极大势值,获得包含t个局部极大势值节点的局部极大势值节点集合;其中,1≤t≤n;计算所述节点的标准矩阵的所有特征值,选取前t-1个非平凡特征值,以所述t-1个非平凡特征值对应的特征向量构建t-1维空间;将所述复杂网络的n个节点映射到所述t-1维空间中;将所述t个局部极大势值节点作为初始聚类中心,采用K-means算法将所述将t-1维空间中的n个节点划分为t个社区。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410129865.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于空分复用系统的方法和装置
- 下一篇:一种中控远程管理方法





