[发明专利]基于多标签传播的网络社区检测方法有效
| 申请号: | 201811247488.2 | 申请日: | 2018-10-25 |
| 公开(公告)号: | CN109379282B | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 汤颖;王斌 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | H04L12/723 | 分类号: | H04L12/723;H04L12/26 |
| 代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
| 地址: | 310014 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 标签 传播 网络 社区 检测 方法 | ||
基于多标签传播的网络社区检测方法,包括:步骤1:数据预处理阶段,计算各个节点的密度值与距离值;步骤2:社区中心点选择;利用各个节点的密度值与距离值,通过DPC决策图选取社区中心点;步骤3:根据社区中心点进行多标签传播,传播结果即为社区检测结果;步骤4:将社区检测结果与数据集中各节点的真实标签进行比较,证明方法的有效性。
技术领域
本发明涉及一种社交网络的社区检测方法。
背景技术
随着信息科技和社交网络的快速发展,人与人之间的联系越方便,社交网络的规模越来越大。如何对庞大的社交网络进行有效的分析以发现有价值的信息是一个很有意义的问题。其中,社区检测方法是一种很重要的网络分析方法。该类方法通过社交网络中各用户之间的联系,将网络划分为多个不同的社区。通常来说,同一个社区内的用户之间具有紧密的联系,而不同社区的用户之间联系较弱。基于社区划分,可以分析不同社区用户的特点,并根据用户所在的社区提供符合该社区用户特点的服务,因此具有很大商业价值。
社区检测方法可分为基于图的划分、基于层次聚类以及标签传播方式。图划分方法需要预先知道网络中的社区数目;层次聚类方法通常时间复杂度高,而且最终检测到的社区数目取决于方法中设定的距离阈值;标签传播方法时间复杂度较低,适用于复杂网络,但是也存在标签更新不稳定、社区数目取决于方法中的特定参数的问题。
发明内容
为了克服现有技术无法准确识别网络中社区数量以及基于标签传播的方法中标签更新不稳定的问题,本发明提供一种新的基于多标签传播的网络社区检测方法来实现社区检测;
本发明利用网络拓扑结构,通过DPC(密度峰值检测算法)识别网络中社区中心点,并基于社区中心点进行多标签传播,从而实现网络社区检测;
基于多标签传播的网络社区检测方法,整体流程图如图1所示,主要分为中心点检测阶段和多标签传播阶段;具体步骤如下:
步骤1:数据预处理阶段,计算各个节点的密度值与距离值;密度值ρ,距离值δ以及密度-距离值γ的计算公式如公式(1)(2)(3)(4)所示:
ξi=∑jηj (1)
ρi=ξi+ηi (2)
γi=ρi×δi (4)
其中ηj表示节点j的度数,ξi表示节点i的所有邻居节点的度数之和,ρi表示节点i的密度值;dij表示节点i和节点j的图最短路径长度,其中节点j为密度值大于节点i的节点,δi表示节点i的密度值;
步骤2:社区中心点选择;利用各个节点的密度值与距离值,通过DPC决策图选取社区中心点;
2.1对节点的密度值和距离值分别进行Z-score标准化,标准化后的密度值ρ*,距离值ξ*以及标准化后的密度-距离值γ*的计算公式如公式(5)(6)(7)所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811247488.2/2.html,转载请声明来源钻瓜专利网。





