[发明专利]节点分析方法、装置、设备及存储介质有效
| 申请号: | 202011499271.8 | 申请日: | 2020-12-17 |
| 公开(公告)号: | CN112612832B | 公开(公告)日: | 2023-02-10 |
| 发明(设计)人: | 李艳红;冯宇波;张俊杰;毛勇岗 | 申请(专利权)人: | 北京锐安科技有限公司 |
| 主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/901 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100044 北京市海淀区西小口*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 节点 分析 方法 装置 设备 存储 介质 | ||
本发明公开了一种节点分析方法、装置、设备及存储介质中,所述节点分析方法包括:获取图数据库的节点信息和边信息,基于节点信息和边信息确定与节点关联的边,针对每个节点,统计与节点关联的边数量,在与节点关联的边数量大于预设阈值时,确定节点是超级节点。本实施例中,通过节点和边的关联关系,确定每个节点拥有的边数量,进而根据边数量确定超级节点,不需要对图数据库中的每个节点进行遍历,提高查找超级节点的效率,减少节点查找对图数据库正常服务时的压力。
技术领域
本发明实施例涉及数据库技术领域,尤其涉及节点分析方法、装置、设备及存储介质。
背景技术
图数据库是NoSQL数据库的一种类型,它应用图形理论存储实体之间的关系信息。最常见的例子,就是社会网络中人与人之间的关系。例如JanusGraph是一个可扩展的图数据库,可以把包含数千亿个节点和边的图存储在多机集群上,使用模块化接口来做数据持久化、索引和客户端访问。Apache HBase是它支持的一种典型后端存储系统。
图数据库中一般存在一些超级节点,超级节点是指拥有的边数对整个网络的边数占比很高的节点。图数据库对与上述超级节点有关的增删改操作效率很差,查询过程中遇到超级节点也会使查询结果爆炸导致图遍历不能继续进行,因此识别出图数据库中的超级节点是非常有必要的。
在数据量非常大时,采用传统的图遍历方式来发现超级节点不仅效率较低,也会对图数据库正常服务产生较大的压力,甚至无法计算并得到全部超级节点。
发明内容
本发明实施例提供了节点分析方法、装置、设备及存储介质,提高查找超级节点的效率,减少节点查找对图数据库正常服务时的压力。
第一方面,本发明实施例提供了一种节点分析方法,包括:
获取图数据库的节点信息和边信息;
基于所述节点信息和所述边信息确定与节点关联的边;
针对每个节点,统计与节点关联的边数量,
在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点。
进一步的,获取图数据库的节点信息和边信息,包括:
加载所述图数据库的元数据文件;
读取并解析所述图数据库的原始记录;
从所述原始记录中获取图数据库的节点信息和边信息。
进一步的,统计与节点关联的边数量,包括:
统计与所述节点关联的边的总数量;
相应的,在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点,包括:在所述与节点关联的边总数量大于第一预设阈值时,确定所述节点是超级节点。
进一步的,统计与节点关联的边数量,包括:获取与所述节点关联的边类型;统计所述边类型分别对应的边数量;
相应的,在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点,包括:
在任意一个所述边类型对应的边数量超过该边类型对应的第二预设阈值时,确定所述节点标识对应的节点是超级节点。
进一步的,获取图数据库的节点标识和边标识之前,还包括:
加载所述图数据库的配置信息;
通过所述配置信息初始化所述图数库管理接口;
通过所述图数库管理接口连接所述所述图数库。
其中,所述配置信息包括:所述图数据库后端存储系统主机名、端口号、表名称和所述预设阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011499271.8/2.html,转载请声明来源钻瓜专利网。





