[发明专利]基于重叠节点的复杂网络社区发现方法在审
申请号: | 201710229682.7 | 申请日: | 2017-04-10 |
公开(公告)号: | CN107103053A | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 马廷淮;刘琴;曹杰;薛羽 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 江苏爱信律师事务所32241 | 代理人: | 唐小红 |
地址: | 210044 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 重叠 节点 复杂 网络 社区 发现 方法 | ||
技术领域
本发明属于数据挖掘技术领域,具体涉及的是一种利用节点权重对信息传播接收标签方法。
背景技术
近年来,随着互联网应用的不断推广,人们越来越多的参与到社交网络中,人们不再局限于地域的差异而紧密联系在一起。因此,人们对社区发现的研究也越来越深入。随着社交网络的迅猛发展,研究学者对社区发现的研究方法与技术也在不断完善和提高。复杂网络就是一个聚宝盆,富含着各种大量的有用信息。比如,我们可以根据网络中用户的兴趣、爱好、关注点以及其他相似特征,得出关于该用户的价值观、兴趣、活动等重要信息。我们可以根据这些属性将多个用户划分在同一个社区,方便统一为该社区用户推送相关信息,降低成本。然而,随着网络用户信息与关系的不断更新与变化,需要处理的数据复杂度不断增加。现有的方法中大多数采用模块度进行判断,但是这个方法无法避免分辨率限制问题,即在社区发现过程中,有时偏爱小社区,有时偏爱大社区。为了解决这个问题,提出了模块度密度这个概念,对复杂网络的社区发现具有重要意义。
Lifang He等在2016年KDD会议上提出了基于和谐模块度的联合社区和结构洞发现算法。该算法主要分为两大部分,首先进行结构洞发现,并在此基础上进行社区发现,寻找最优的社区发现结果。它主要是将定义的和谐方程转化为对L范式的求解。根据大量的对比实验发现,大多数算法对结构洞的定义理解具有偏差,从而导致结果的千差万别,但是根据去除结构洞节点前后的社区发现结果对比发现,后来的效果明显要好于先前。
本发明是根据分析该文章的方法,将结构洞引申到重叠节点,涉及一种基于重叠节点的复杂网络社区发现,能够更加快速有效的进行社区发现。
发明内容
本发明所要解决的技术问题是在标签传播过程中对重叠节点的发现以及重叠节点的选择,使得具有较低权重的重叠节点被发现,使得去除掉这些重叠节点后社区的结构特征更加明显,提高社区发现的正确性。
技术方案如下:
基于重叠节点的复杂网络社区发现方法,包括以下步骤:
步骤1),初始化整个网络,网络中的每个节点分配唯一的一个标签,以其标签初始化节点内存;
步骤2),信息接收者挑选,在步骤1)得到的初始化的节点,随机选择一个节点作为信息接收者;
步骤3),信息传播,在步骤2)中确定一个节点信息接收者,该节点的每一个邻居节点根据传播规则发送一个标签;
步骤4),信息接收,信息接收者根据接收规则接受在步骤3)中发送来的一个标签。再执行步骤2),直到满足停止条件;
步骤5),重叠节点发现,在这个阶段,把具有多个不同标签的节点记录下来即为重叠节点;
步骤6),节点权重,根据步骤5),获得重叠节点,计算这些节点的权重;
步骤7),k重叠节点的选择,根据步骤6),将节点的权重按升序排列,从中选择前k个重叠节点;
步骤8),社区发现,分别对移除k个重叠节点前后的网络节点进行社区发现。
进一步的,基于重叠节点的复杂网络社区发现算法,步骤1),初始化网络图结构,给网络中的每个节点分配一个标签,每个节点的标签必须有且仅有一个,根据节点的标签进行内存初始化。
进一步的,基于重叠节点的复杂网络社区发现算法,步骤3),信息传播,根据传播规则选择一个标签进行传播。其传播规则为从其存储器中选择随机标签,其概率与存储器中该标签出现的频率成比例。
进一步的,基于重叠节点的复杂网络社区发现算法,步骤4),信息接收,信息接收者根据接收规则接受发送来的一个标签。其接收规则为从当前步骤中挑选最受欢迎即出现频率最高的标签。
进一步的,基于重叠节点的复杂网络社区发现算法,步骤5),重叠节点发现。当迭代停止后,对每一个节点历史标签序列中各标签出现的频率做统计,与一个给定阈值γ(γ=0.5)相比较,如果小于γ,则删除节点的此标签信息,否则保留,最终具有多个不同标签的节点即为重叠节点。
终止条件包括:
(1)达到迭代次数;
(2)收集到充分的信息后任意时间均可停止。
进一步的,基于重叠节点的复杂网络社区发现算法,步骤6),重叠节点权重,其用于衡量节点在网络中的影响力,它的值越大表明节点的影响力越大,反之亦然。计算重叠节点权重,其定义为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710229682.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于冷却磁共振成像装置的系统和方法
- 下一篇:电磁线圈结构之系统及方法