[发明专利]一种社群划分方法、装置、存储介质及电子装置在审
申请号: | 201911419710.7 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111159577A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 姜旭;李嘉琛 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 张秀英 |
地址: | 100086 北京市海淀区中关村东路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社群 划分 方法 装置 存储 介质 电子 | ||
1.一种社群划分方法,其特征在于,包括:
将关系数据处理为图结构数据;
统计所述图结构数据的联通性,将所述图结构数据划分为第一社群集合,其中,所述第一社群集合包括第一数量的社群;
在所述第一数量小于预先设置的社群数量的情况下,通过标签传播算法LPA将所述图结构数据划分为第二社群集合,其中,所述第二社群集合包括第二数量的社群,所述第二数量大于或等于所述预先设置的社群数量;对所述第二社群集合中的社群进行中心度计算,确定所述第二社群集合中社群的中心点;和/或,
在所述第一数量大于或等于所述预先设置的社群数量的情况下,对所述第一社群集合中的社群进行中心度计算,确定所述第一社群集合中社群的中心点。
2.根据权利要求1所述的方法,其特征在于,通过标签传播算法LPA将所述图结构数据划分为第二社群集合包括:
为所述图结构数据中每个节点配置一个标签;
对所述每个节点执行以下步骤,对于执行以下步骤的节点称为当前节点:
重复统计所述当前节点的邻居节点的标签,将出现次数最多的邻居节点的标签更新所述当前节点的标签,直到所述当前节点的标签为邻居节点的标签中出现次数最多或最多的之一;
将具有相同标签的节点划分到同一个社群中,得到所述多个第二社群。
3.根据权利要求2所述的方法,其特征在于,将出现次数最多的邻居节点的标签更新所述当前节点的标签包括:
在出现次数最多的邻居节点的标签为多个的情况下,从出现次数最多的多个邻居节点的标签中随机选择一个邻居节点的标签确定为所述当前节点的标签。
4.根据权利要求2所述的方法,其特征在于,为所述图结构数据中的每个节点配置一个标签包括:
将所述图结构数据中每个节点的节点标识ID配置为所述每个节点的标签ID。
5.根据权利要求1所述的方法,其特征在于,在通过标签传播算法LPA将所述图结构数据划分为第二社群集合之后,所述方法还包括:
组合所述第二社群集合的社群中包含社群中所有节点的所有边,重新构建第三社群集合,其中,所述第三社群集合包括第三数量的社群;
对所述第三社群集合中的社群进行连通性分析,保留节点数量最多的社群,得到第四社群集合,并将出所述第四社群集合的社群的节点之外的其他节点的标签清零,其中,所述第四社群集合包括第四数量的社群;
对所述第二社群集合中的社群进行中心度计算,确定所述第二社群集合中社群的中心点包括:
对所述第四社群集合中的社群进行中心度计算,确定所述第二社群集合中社群的中心点。
6.根据权利要求5所述的方法,其特征在于,在对所述第三社群集合中的社群进行连通性分析,保留节点数量最多的社群,得到第四社群集合之后,所述方法还包括:
对所述第四社群集合中的社群进行社群亲密度检测,统计所述第四社群集合的社群中具有标签的节点数量;
判断所述第三社群集合社群的节点数量是否大于或等于预定阈值;
在判断结果为是的情况下,将所述第四社群集合的社群中所述节点数量大于或等于所述预定阈值的社群中所有节点的标签清零;
统计所有节点的标签信息,对所有未设置标签的节点通过标签传播算法LPA重新进行社群划分。
7.根据权利要求1至6中任一项所述的方法,其特征在于,将所述关系数据处理为所述图结构数据包括:
获取所述关系数据中包含源节点与目标节点之间的边数据的集合,其中,所述边数据包括源节点的属性、目标节点的属性以及源节点与目标节点之间的边的属性;
根据所述边数据的集合构建所述图结构数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911419710.7/1.html,转载请声明来源钻瓜专利网。