[发明专利]一种基于谱聚类与模糊集的重叠社区发现方法在审
申请号: | 201810750497.7 | 申请日: | 2018-07-10 |
公开(公告)号: | CN108920678A | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 郭昆;何晓珊;郑建宁;廖勤武 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 重叠社区 属性信息 归属度 模糊集 模块度 相似度 构建 聚类 社区 读取 矩阵 网络结构图 相似度矩阵 方法生成 复杂网络 划分结果 计算网络 社交网络 重叠结构 归一化 数据集 正交化 发现 迭代 网络 输出 压缩 | ||
1.一种基于谱聚类与模糊集的重叠社区发现方法,其特征在于,包括如下步骤:
步骤S1:读取社交网络的数据集,生成网络结构图并获取网络中节点的属性信息和拓扑结构;
步骤S2:结合网络中相邻节点之间的Jaccard系数和节点的属性信息,计算网络中节点之间的相似度值;
步骤S3:基于节点间的相似度值,构建相似度矩阵,从而构建归一化后的拉普拉斯矩阵;
步骤S4:计算每个节点的特征向量和特征值,利用迭代和压缩的方法生成新的特征向量;
步骤S5:将新的特征向量正交化,计算每个节点针对每个社区的归属度,进行社区的划分,对存在多个社区归属度值较大的节点,进行重叠社区的划分;
步骤S6:根据每次划分后的模块度,选出满足模块度要求最高的社区划分;
步骤S7:输出最终的社区划分结果。
2.根据权利要求1所述的一种基于谱聚类与模糊集的重叠社区发现方法,其特征在于,在步骤S1中,读取社交网络的数据集,生成用于社区结构划分的网络结构图G=(V,E,F),其中V表示节点集,E表示边集,F表示特征属性集,同时获取网络节点的拓扑结构:
其中,Aij表示邻接矩阵,eij表示节点i和节点j之间的边。
3.根据权利要求2所述的一种基于谱聚类与模糊集的重叠社区发现方法,其特征在于,在步骤S2中,计算网络中节点之间的相似度值的具体步骤如下:
步骤S21:表示出网络中每个节点的邻居集:
Γ(v)={u:u∈V,(v,u)∈E} (2)
其中,Γ(u)表示节点u的邻居集合,节点v表示为节点u的邻居节点;
步骤S22:计算任意两个节点之间的Jaccard系数:
Juv计算出来的值表示为节点u与节点v的Jaccard系数,Juv用于衡量节点之间的相似程度,Juv值越大表示两个节点之间越相似,反之则表示两个节点越不相似;
步骤S23:根据节点的属性信息,计算每两个节点之间的属性相似度:
SD(u,v)=haming(u,v) (4)
SD(u,v)计算出来的值表示节点u与节点v的属性系数,用来衡量节点之间在属性上相似程度,SD(u,v)值越大表示两个节点之间越相似,反之亦然;
步骤S24:根据Jaccard系数和节点的属性系数,计算每个节点的总相似度S(u,v):
S(u,v)=Juv+SD(u,v) (5)
其中,Juv两节点之间的Jaccard系数,SD(u,v)表示两节点间的属性系数;S(u,v)越大,表示节点u和v在网络中越相似,极有可能划分到同一个社区。
4.根据权利要求3所述的一种基于谱聚类与模糊集的重叠社区发现方法,其特征在于,所述步骤S3的具体实现步骤如下:
步骤S31:统计节点u与节点v的相似度值,构建出相似度矩阵S;
步骤S32:利用相似度矩阵S计算出度矩阵D的值;
步骤S33:利用度矩阵D和原始的相似度矩阵S,进行归一化操作,计算出归一化后的拉普拉斯矩阵W:
W=D-1S (6)
其中,D表示度矩阵中元素的值,S表示为相似度矩阵中元素的值,W为归一化后的拉普拉斯矩阵中元素的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810750497.7/1.html,转载请声明来源钻瓜专利网。