[发明专利]一种基于谱聚类与模糊集的重叠社区发现方法在审
申请号: | 201810750497.7 | 申请日: | 2018-07-10 |
公开(公告)号: | CN108920678A | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 郭昆;何晓珊;郑建宁;廖勤武 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 重叠社区 属性信息 归属度 模糊集 模块度 相似度 构建 聚类 社区 读取 矩阵 网络结构图 相似度矩阵 方法生成 复杂网络 划分结果 计算网络 社交网络 重叠结构 归一化 数据集 正交化 发现 迭代 网络 输出 压缩 | ||
本发明涉及一种基于谱聚类与模糊集的重叠社区发现方法。包括:1、读取社交网络的数据集,生成网络结构图并获取网络中节点的属性信息等;2、结合网络中节点的
技术领域
本发明涉及复杂网络上的重叠社区发现技术领域,特别是一种基于谱聚类与模糊集的重叠社区发现方法。
背景技术
随着互联网信息交互的迅速发展,出现了各种各样复杂的网络结构,例如社交网络、科学家合作网络、食物链网络、新陈代谢网络等。在社交网络中,每个节点代表网络中的个体,而边代表个体间的联系,边的属性值则代表个体间更为具体的联系。社交网络中的社区结构通常表现为社区内部的节点连接紧密,而社区间的节点连接稀疏。社区发现是研究复杂网络结构的关键技术之一。目前,社区发现的研究成果可以被应用于社会学、个性化兴趣推荐系统、心理学、蛋白质功能预测等诸多领域。
为了高效准确的挖掘出复杂网络中重要的社区结构,近些年已有大量研究员和学者对其展开深入研究。传统的社区发现算法包括基于划分的方法、层次聚类算法、图分割的方法、基于团的方法、基于密度的方法、基于表征学习的方法、基于自动编码器的方法、标签传播等。这些算法虽然可以较好的发现网络社区结构,但只能发现凸球形的样本空间中的网络社区结构,不能发现各种形状的社区结构,同时容易陷于局部最优解的困境,所以有研究员将图论中的谱聚类应用到社区发现,提出基于谱聚类的社区发现算法。
目前已有很多学者对基于谱聚类的社区发现进行研究,也取得了一些成果,但仍然存在以下几个问题:首先算法的时间与空间复杂度相对其他种类的算法较高,在处理大规模网络时存在不足;其次,算法不能发现重叠社区结构;最后,在社区划分的过程中对参数的选择不具有稳定性,导致社区发现的精度不高。
发明内容
本发明的目的在于提供一种基于谱聚类与模糊集的重叠社区发现方法,该方法可以高效、准确地对复杂网络的重叠结构进行划分。
为实现上述目的,本发明的技术方案是:一种基于谱聚类与模糊集的重叠社区发现方法,包括如下步骤:
步骤S1:读取社交网络的数据集,生成网络结构图并获取网络中节点的属性信息和拓扑结构;
步骤S2:结合网络中相邻节点之间的Jaccard系数和节点的属性信息,计算网络中节点之间的相似度值;
步骤S3:基于节点间的相似度值,构建相似度矩阵,从而构建归一化后的拉普拉斯矩阵;
步骤S4:计算每个节点的特征向量和特征值,利用迭代和压缩的方法生成新的特征向量;
步骤S5:将新的特征向量正交化,计算每个节点针对每个社区的归属度,进行社区的划分,对存在多个社区归属度值较大的节点,进行重叠社区的划分;
步骤S6:根据每次划分后的模块度,选出满足模块度要求最高的社区划分;
步骤S7:输出最终的社区划分结果。
在本发明一实施例中,在步骤S1中,读取社交网络的数据集,生成用于社区结构划分的网络结构图G=(V,E,F),其中V表示节点集,E表示边集,F表示特征属性集,同时获取网络节点的拓扑结构:
其中,Aij表示邻接矩阵,eij表示节点i和节点j之间的边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810750497.7/2.html,转载请声明来源钻瓜专利网。