[发明专利]一种基于局部路径的社团发现算法在审
申请号: | 202011623050.7 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112989272A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 雍胜凯;王元卓;程伯群;赵俊霞;赵起;谷世宇 | 申请(专利权)人: | 中科院计算技术研究所大数据研究院 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06K9/62 |
代理公司: | 郑州明华专利代理事务所(普通合伙) 41162 | 代理人: | 高丽华 |
地址: | 450000 河南省郑州*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 局部 路径 社团 发现 算法 | ||
本发明属于大数据处理技术领域,具体涉及一种基于局部路径的社团发现算法,为解决传统社团发现算法从全局出发所带来的弊端,采用从局部的指定节点出发,逐步蔓延式增加,尤其对较大的网络结构进行社团划分非常实用有效,发现过程高效且在效果上与全局式社团发现相当,通过输入节点迅速发现相关群体,在群体判断中加入时间弱关联进行群体筛选,可有效降低群体误判率,提高了局部社团效果,并可对社团内相关性强但是非社团成员进行合理的删减,增强社团发现的准确性。
技术领域
本发明属于大数据处理技术领域,具体涉及一种基于局部路径的社团发现算法。
背景技术
人们发现许多实际网络均具有社团结构,即整个网络由若干个社团组成,社团之间的连接相对稀疏、社团内部的连接相对稠密。社团发现则是利用图拓扑结构中所蕴藏的信息从复杂网络中解析出其模块化的社团结构,该问题的深入研究有助于以一种分而治之的方式研究整个网络的模块、功能及其演化,更准确地理解复杂系统的组织原则、拓扑结构与动力学特性,具有十分重要的意义。
银行掌握数据资源较多,节点数以亿计,在整个网络中,如果从全局角度进行社团发现,其计算量需求较大,社团模块度不好把控,模块度设置高了获取社团较多,模块度低了,洗钱社团可能包含较多存在关系的正常用户。
传统社团发现算法通常在全局的网络上进行社团划分,随着网络规模的扩张,传统算法弊端显现,主要表现是:模型性能不高、效率低,不能满足人们的需求,因此研究一种基于局部路径的社团发现算法是必要的。
发明内容
针对现有设备存在的缺陷和问题,本发明提供一种基于局部路径的社团发现算法,有效的解决了现有设备中存在的模型性能不高和效率低的问题。
本发明解决其技术问题所采用的方案是:一种基于局部路径的社团发现算法,包括如下步骤:
步骤1,数据获取
从数据库中获取指定节点,并获取与该指定节点存在直接相关或者一级间接相关的关联节点;
步骤2:数据预处理
获取指定节点与关联节点的原始关系,基于时间后延性及数据相等性的弱去重逻辑对原始关系进行去重,得到指定节点与关联节点的有效关系;然后指定有效关系确定时间段内的往来次数和所有往来的总数值作为边指标;
步骤3,计算局部相似性系数
如果该确定时间段内节点的所有往来次数超过预设次数y,且总数值大小超过预设数值x,则判定节点与关联节点的往来关系为a,否则为b,且a+b=1;然后根据a和b的值获得该节点网络的邻接矩阵Aij;
根据三阶邻接矩阵进行局部相似性系数计算:
式中λ为最大特征值,Aij为邻接矩阵,Sij为局部相似性系数;
步骤4,局部相似性系数与阈值对比
将步骤3中获得的局部相似性系数与设定阈值进行对比,如果局部相似性系数大于设定阈值则该节点网络加入社团,否则不加入;通过局部系数判断进行社团扩展,直至全部节点划分完毕;
步骤5,采用局部模块度检验获得社团的合理性
定义社团的节点集合为V,V*为V的邻接节点,V*的邻接矩阵为
定位局部模块度
其中δ(ci,cj),如果i,j都在V中,则为1,否则为0; m*标识邻接矩阵内边的数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科院计算技术研究所大数据研究院,未经中科院计算技术研究所大数据研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011623050.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于纸盒生产用的折边机
- 下一篇:一种目标图像信息识别方法及其装置