[发明专利]一种基于节点连接和属性相似度的社团发现方法和系统在审
| 申请号: | 202010948386.4 | 申请日: | 2020-09-10 |
| 公开(公告)号: | CN112084425A | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | 张能锋;张俊;胡伦 | 申请(专利权)人: | 深圳市万佳安人工智能数据技术有限公司 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F17/11;G06F17/16;G06Q50/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 518000 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 节点 连接 属性 相似 社团 发现 方法 系统 | ||
本发明提出了一种基于节点连接和属性相似度的社团发现方法和系统,包括网络构建模块、数据初始化模块、模型构建模块、模型求解模块、社团发现模块以及结果展示模块,其中,所述网络构建模块将社交网络数据构建为基于链接的网络,数据初始化模块执行服务器计算指令,获得网络的邻接矩阵、属性相似度矩阵和拓扑结构矩阵,并初始化相似度矩阵,模型构建模块获取输入参数后在服务器构建关于相似度矩阵的最优化问题,模型求解模块在得到模型构建模块构建完成的指令后开始对最优化问题进行迭代求解,计算获得最优的相似度矩阵,社团发现模块在得到最优的相似度矩阵后执行社团发现指令,最后将社团发现结果通过展示模块进行输出展示。本发明直接作用于带有节点属性的社交网络数据集合,能够针对社交网络中重叠社团进行发现,效果准确度高,能够解决社交网络中的社团发现问题。
技术领域
本发明涉及计算机数据处理技术领域,特别涉及到社交网络中的社团发现问题。
背景技术
近年来社交网络快速发展,例如新浪微博、微信、各种在线论坛等,这类网络是互联网重要的组成部分。由于社团在网络系统中扮演着重要的角色,近年来对社交网络分析的社团检测研究激增。社交网络由用户和用户之间相互关系构成,把网络中的用户抽象为节点,用户之间的关系抽象成边,这样可以把社交网络抽象为图的形式进行研究。
然而,许多真实的网络具有更复杂的重叠社团结构,以及社团中用户包含着各种属性,所以传统的基于社交网络的拓扑结构的社团发现方法不能很好的识别重叠社团结构,同时忽视了用户相关联的属性信息在社团发现工作中起到的重要作用。例如,某社交平台中,某用户和他不同的好友分别在不同的群组里,如果仅基于网络拓扑结构,当该用户被识别在某个群组里时,可能就会忽视该用户也在其他群组里的情况。
发明内容
针对上述缺陷和不足,本发明的目的在于提供一种基于链接和节点属性相似度社交网络社团发现方法和系统,通过综合考虑社交网络中重叠社团及节点属性相似度程度实现社团发现。
本发明通过以下技术方案来实现:
本发明公开了一种基于节点连接和属性相似度的社团发现方法,包括以下步骤:
步骤一,通常将社交网络中的用户抽象为网络中节点,两个用户之间的联系构成边,现在将此网络转换了基于链接的新网络,边作为新网络中的节点,相邻的边作为新网络中的边,如图2所示。对新网络中的数据进行预处理,其中包括:所有节点的集合,两节点之间边构成的集合,与节点相关联的所有属性的集合;
步骤二,根据步骤一预处理的结果求出所述网络的邻接矩阵、属性相似度矩阵和拓扑结构矩阵,定义并初始化相似度矩阵;
步骤三,基于步骤二所得节点的邻接矩阵、属性相似度矩阵、拓扑结构矩阵和初始化的相似度矩阵,构建关于相似度矩阵的最优化问题;
步骤四,求解步骤三中构建的最优化问题,得出相似度矩阵的最优解;
步骤五,根据步骤四所得相似度矩阵,经过处理后获取所发现的社团。
步骤二在求解属性相似度矩阵时用到了Jaccard相似度,求解拓扑结构矩阵时用到了Simrank。步骤四在求解最优化问题时,采用交替优化的策略,构建Karush-Kuhn-Tucker(KKT)条件来获得更新公式。在初始化相似度矩阵的情况下,根据更新公式不断地更新迭代,直到步骤五所得最优化问题的目标函数收敛。此时的相似度矩阵作即为最佳的相似度矩阵。
本发明公开了一种基于节点连接和属性相似度的社团发现系统,该系统包括:
网络构建模块,将包含了大量属性信息的社交网络构建成为一个基于链接的网络;
数据初始化模块,根据前一个模块中的得到的网络进行数据处理获得节点的邻接矩阵、节点属性相似度矩阵和拓扑结构矩阵,初始化对于网络的相似度矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市万佳安人工智能数据技术有限公司,未经深圳市万佳安人工智能数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010948386.4/2.html,转载请声明来源钻瓜专利网。





