[发明专利]一种基于节点综合影响力的标签传播重叠社区发现方法在审
| 申请号: | 202111482396.4 | 申请日: | 2021-12-06 |
| 公开(公告)号: | CN114417177A | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 刘洪涛;沈彦秀 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 黄宗波 |
| 地址: | 400065*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 节点 综合 影响力 标签 传播 重叠 社区 发现 方法 | ||
本发明涉及大数据挖掘技术领域,公开了一种基于节点综合影响力的标签传播重叠社区发现方法,根据节点的拓扑信息:度、三角形数和局部平均度计算网络中节点重要性LI;依据节点及其邻居的相似度Sim及节点亲密度NI计算节点相似性影响力SI;根据节点重要性LI和相似性影响力SI计算节点综合影响力CI,将所有节点按节点重要性LI排序,并为每个节点初始化一个唯一标签和主标签,保留满足阈值的标签并归一化;检查所有标签并删除不满足节点个数阈值的标签并保留这些标签中的节点,再次计算隶属系数并重新分配社区。本发明采用异步更新节点的标签,结束条件是两次主标签不变或达到了最大迭代值,能够高效及准确的发现复杂网络中的重叠节点和社区结构。
技术领域
本发明涉及大数据挖掘技术领域,尤其涉及一种基于节点综合影响力的标签传播重叠社区发现方法。
背景技术
现实世界中存在着许多复杂的网络数据,如传染病传播网络和社交网络数据。这些复杂网络具有“小世界”和“无标度”的特点,结构特征包括度、最短路径长度和节点的中介性。此外,复杂网络数据中还有更深层次的结构信息。这种社区结构意味着一个网络被分成几个组,使得每个组内的节点密集连接,而不同组之间的节点稀疏连接。属于同一社区的节点具有相似的特征或紧密的联系。目前,许多科学家们意识到从这些高维、复杂的网络数据中挖掘出社区结构对网络科学具有重要的研究价值。例如,我们可以使用社区发现算法来研究Twitter用户网络,并根据不同用户的社区提供个性化推荐。许多研究表明社区与社区之间存在重叠的区域,而这些重叠的区域就是社区之间通信和联系的关键。因此研究重叠社区对于生物组织,犯人侦测,网络社交等领域有重要的理论意义和实用价值。
社区发现是将具有紧密联系的组织聚类的过程,网络数据通常以其拓扑信息进行存储,而并没有直接给出一个节点在网络中的重要性关系及节点间的相似性度量信息。此外,大多数网络数据中的稀疏连接和节点间的差异给重叠社区的检测带来了困难。如何将节点的特征和节点之间的拓扑关系相结合以衡量一个节点的重要性,仍然是一个值得学者们探讨的问题。虽然节点聚类系数和节点中心性能够在一定程度上将节点的特征转换为节点的重要性,比如Kouni I,Karoui W,Romdhane L B.Node Importance based LabelPropagation Algorithm for overlapping community detection in networks[J].Expert Systems with Applications,2019,162:113020.和Ding X,Zhang J,YangJ.Node-community membership diversifies community structures:An overlappingcommunity detection algorithm based on local expansion and boundary re-checking[J].Knowledge-Based Systems,2020,198:105935。但这些方法并没有充分用节点的局部拓扑信息。此外,依据节点间拓扑信息来衡量节点间的相似关系是在社区发现算法中的重要步骤之一。当前使用较多的是Jaccord相似性和余弦相似性计算方法等。但这些计算节点亲密度的算法是计算邻居节点相同的个数与节点度的关系,并未考虑到其他的拓扑信息。
基于局部扩展的社区发现方法,思想简单,划分的质量较好,因此得到了广泛的关注。但是这类社区发现方法往往需要重复计算每一个节点的邻居加入该社区后的隶属度或者使用模型计算节点间的距离,增加了该算法的复杂性。例如基于局部扩展的LFM算法、基于密度峰值的聚类发现算法等。这些算法检十万条边以上的网络中的社区非常困难。目前也有部分研究者基于标签传播的重叠社区发现算法,但之前的标签传播发现方法大多数只能用于检测非重叠社区。
发明内容
有鉴于此,本发明的目的是提供一种基于节点综合影响力的标签传播重叠社区发现方法,能够高效及准确的发现复杂网络中的重叠节点和社区结构。
本发明通过以下技术手段解决上述技术问题:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111482396.4/2.html,转载请声明来源钻瓜专利网。





