[发明专利]一种基于模糊关系的重叠社区划分方法在审
| 申请号: | 202310221355.2 | 申请日: | 2023-03-09 |
| 公开(公告)号: | CN116232920A | 公开(公告)日: | 2023-06-06 |
| 发明(设计)人: | 刘洪涛;张斌弛;张岩;武宁 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | H04L41/142 | 分类号: | H04L41/142;H04L41/14;H04L41/12;G06F18/2337;G06F18/22;G06Q50/00 |
| 代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 方钟苑 |
| 地址: | 400065 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 模糊 关系 重叠 社区 划分 方法 | ||
本发明涉及一种基于模糊关系的重叠社区划分方法,属于自然语言处理领域,包括以下步骤:S1:对获得的社区数据进行预处理,预设最小连接度,将低于最小连接度的节点过滤;S2:将给定节点的拥有最高中心度的最邻近节点命名为NGC节点,计算每个节点对应的NGC节点;S3:计算节点与其对应NGC节点间的模糊关系;S4:对社区进行划分,获得重叠社区。本方法将局部信息应用于传统的社区划分算法中与种子拓展原理结合,使用人工网络与真实网络数据得到重叠社区划分结果,是一种能在保证较低时间复杂度的前提下,如实反映社区结构的社区检测算法。
技术领域
本发明属于自然语言处理领域中的社区划分方法,涉及一种基于模糊关系的重叠社区划分方法
背景技术
在现实世界中充斥着大量的网络,这些网络通常可以抽象为由节点和边组成,其中有些网络中的边包含权重属性,如工程施工问题中的最优路径;有些网络中的节点包含独特属性,如某些节点间存在更高的依赖关系,而另一些节点间则存在着互斥的倾向。但总而言之,只要是形如点和边组成的存在一定相互作用的网络结构,均可称之为复杂网络,并成为我们研究的内容。而复杂网络的所有属性中,最为重要也是最为值得研究的则是网络的社区检测,即将整个网络依据一定原则,划分为一个个我们称之为社区的具有某种相似性的节点集合,因为其蕴含着整个网络的拓扑结构,以及社区间节点的关系。
对于社区的概念,从来没有一个得到所有学者公认的定义,但是通常来说,可以将社区理解为一组节点的集合,其特征是社区的内部节点紧密相连,而社区之间的节点连接相对稀疏[1]。揭示复杂网络中的社区并挖掘社区之间隐藏的关系对于复杂网络分析至关重要。社区检测是一个复杂而有意义的过程,它在研究复杂网络结构中起着重要作用,其目标是将网络划分为多个社区,并且获得的社区符合社区的一般定义,藉此可以对网络进行进一步的分析,如消费者行为的预测、作家写作风格的鉴定、未来一段时期发生某种周期性事件的概率等等。
以往的经典算法由于目标网络相对较小,往往注重了算法的性能而忽略了算法的效率,在现实网络逐渐增长的现在,许多算法暴露出了原来没有的缺陷:由于算法中使用过多的全局信息,导致计算成本过高。
发明内容
有鉴于此,本发明的目的在于提供一种基于模糊关系的重叠社区发现方法,同时拥有局部信息的良好时间性能和重叠社区的划分准确性、覆盖率等性能,在较低的计算时间内产生模块化程度较高、与真实情况更为一致的社区。
为达到上述目的,本发明提供如下技术方案:
一种基于模糊关系的重叠社区划分方法,包括以下步骤:
S1:对获得的社区数据进行预处理,预设最小连接度,将低于最小连接度的节点过滤;
S2:将给定节点的拥有最高中心度的最邻近节点命名为NGC(Nearest node withGreater Centrality)节点,计算每个节点对应的NGC节点;
S3:计算节点与其对应NGC节点间的模糊关系;
S4:对社区进行划分,获得重叠社区。
进一步,步骤S1所述预处理具体包括以下步骤:
S11:找到网络中的最大二连通核;
S12:删去最大二连通核以外的须,并在社区划分步骤结束以后还原。
进一步,步骤S2具体包括以下步骤:
S21:计算节点邻居相似性,用于衡量两节点间的相似程度C(vi,vj):
C(vi,vj)=|n(vi)∩n(vj)|
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310221355.2/2.html,转载请声明来源钻瓜专利网。





