[发明专利]基于K-核迭代因子和社区隶属度的重叠社区划分方法在审
申请号: | 201910289422.8 | 申请日: | 2019-04-11 |
公开(公告)号: | CN109978710A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 朱征宇;杜小东;赵亮;赵福强;赵芳舟 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F16/901 |
代理公司: | 重庆市前沿专利事务所(普通合伙) 50211 | 代理人: | 孔祥超 |
地址: | 400045 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 迭代因子 社区 节点影响力 集合 计算网络 种子节点 重叠社区 隶属度 读取 节点密度计算 归一化处理 邻接信息表 网络结构图 局部社区 网络数据 合并 网络 | ||
本发明公开基于K‑核迭代因子和社区隶属度的重叠社区划分方法,包括以下几个步骤:S1:读取网络数据集,生成网络结构图G并获取网络各节点的邻接信息表Nij;S2:计算网络结构图G中各节点的K‑核迭代因子;S3:计算网络结构图G中各节点的节点密度,并对节点密度进行归一化处理;S4:结合K‑核迭代因子和节点密度计算节点影响力,并选取节点影响力最大的节点作为种子节点;S5:以种子节点为核心进行局部社区扩展得到子社区,从而得到第一次社区划分集合;S6:将第一次社区划分集合中的子社区进行合并,从而得到第二次社区划分集合。
技术领域
本发明涉及重叠社区划分技术领域,特别涉及基于K-核迭代因子和社区隶属度的重叠社区划分方法。
背景技术
重叠社区的发现主要是利用社区的局部扩展特性。在现实世界中,很多复杂的相互作用的关系往往被抽象成复杂网络图来表示,节点表示网络中的个体,边表示节点之间存在相互关系。其中,存在一些节点同时属于不同的社区,这便是重叠社区结构,社区结构在一定程度上也可以表示为真实网络的拓扑关系。重叠社区的准确划分应用有助于更好的理解网络拓扑结构和功能。在挖掘网络用户团体、流行病传播学中的预防控制、舆情监测等方面起到重要作用。
但现有技术是采用随机选择种子节点,造成时间复杂度较高,不适合应用在大型网络中,而且会导致社区划分结果不稳定、准确率不高的问题。
发明内容
针对现有技术的重叠社区发现过程中种子节点选择的随机性的问题,本发明通过将迭代因子思想和节点密度值相结合得到节点影响力从而选择种子节点,再通过节点影响力计算得到社区隶属度,根据社区隶属度选择性添加节点进行社区扩张,提升社区划分质量和准确率。
为了实现上述目的,本发明提供以下技术方案:
基于K-核迭代因子和社区隶属度的重叠社区划分方法,包括以下几个步骤:
S1:读取网络数据集,生成网络结构图G并获取网络各节点的邻接信息表Nij;
S2:计算网络结构图G中各节点的K-核迭代因子;
S3:计算网络结构图G中各节点的节点密度,并对节点密度进行归一化处理;
S4:结合K-核迭代因子和节点密度计算节点影响力,并选取节点影响力最大的节点作为种子节点;
S5:以种子节点为核心进行局部社区扩展得到子社区,从而得到第一次社区划分集合;
S6:将第一次社区划分集合中的子社区进行合并,从而得到第二次社区划分集合。
优选的,所述步骤S2中,所述K-核迭代因子的计算公式如下:
公式(1)中,δi表示节点i的K-核迭代因子,ki表示节点i的核心等级,表示在计算ki时的迭代次数,ni表示在次迭代中节点被移除时的次数。
优选的,所述步骤S3中,所述节点密度的计算公式如下:
公式(2)中,ds(i)表示节点i的密度,Ni表示节点i的邻接节点集合,dj表示节点j的度值;
所述对节点密度进行归一化处理的计算公式如下:
公式(3)中,lo(i)表示归一化处理后的节点i的密度,ds(i)表示节点i的密度,ds(m)表示节点m的密度,V表示网络结构图中的节点集合。
优选的,所述步骤S4中,所述节点影响力的计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910289422.8/2.html,转载请声明来源钻瓜专利网。