[发明专利]图数据处理方法、装置、计算设备、存储介质和程序产品在审
申请号: | 202111075644.3 | 申请日: | 2021-09-14 |
公开(公告)号: | CN114327363A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 王贺雨;蒋杰;李晓森;欧阳文;肖品;陶阳宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F7/498 | 分类号: | G06F7/498 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 曹芳;陈岚 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 计算 设备 存储 介质 程序 产品 | ||
1.一种图数据处理方法,其特征在于,包括:
获取有向图数据,所述有向图数据包括与多个节点相关的多项边数据,其中每项边数据表示一条从源节点指向尾节点的边,并包括相应的源节点标识和尾节点标识;
基于所获取的有向图数据,在参数服务器上为每个节点创建相关联的基数计数器,每个基数计数器被配置为基于被添加至该基数计数器的节点标识来确定基数估算值;
基于每个节点的节点信息初始化与该节点相关联的基数计数器,所述节点信息包括节点标识;
迭代更新所述基数计数器,直至达到期望迭代轮次数,在每轮次迭代中执行以下迭代操作:针对每个源节点,从所述参数服务器获取与该源节点相关联的基数计数器,并将所获取的基数计数器传送至与该源节点相关的所有尾节点;针对每个尾节点,基于所接收的来自该尾节点的所有相关源节点的基数计数器更新所述参数服务器上的与该尾节点相关联的基数计数器;
基于迭代更新后的基数计数器,确定所述多个节点中的至少一个节点的期望阶数的邻域内的节点数量,其中所述期望阶数与所述期望迭代轮次数相等。
2.根据权利要求1所述的方法,其中,所述获取有向图数据包括:
接收无向图数据,所述无向图数据包括与多个节点相关的多项边数据,其中每项边数据表示一条连接两个节点的边,并包括相应的两个节点标识;
基于所述无向图数据中的每项边数据,交换两个节点标识的位置,以生成附加边数据;
将所述无向图数据中的多项边数据和所生成的多项附加边数据的组合作为所述有向图数据。
3.根据权利要求1所述的方法,其中,所述节点信息还包括节点标签,并且其中,所述基于每个节点的节点信息初始化相关联的基数计数器包括:
当该节点的节点标签属于目标标签时,将该节点的节点标识添加至相关联的基数计数器,以便将该基数计数器的基数估算值初始化为1;
当该节点的节点标签不属于目标标签时,不将该节点的节点标识添加至相关联的基数计数器,以便将该基数计数器的基数估算值初始化为0。
4.根据权利要求1-3中任一项所述的方法,其中,所述基于所接收的来自所有相关源节点的基数计数器更新所述参数服务器上的与该尾节点相关联的基数计数器包括:
对所接收的来自所有相关源节点的基数计数器进行去重合并,以生成更新基数计数器;
基于所生成的更新基数计数器更新所述参数服务器上的与该尾节点相关联的基数计数器。
5.根据权利要求4所述的方法,其中,所述基于所生成的更新基数计数器更新所述参数服务器上的与该节点相关联的基数计数器包括:
将所生成的更新基数计数器推送至所述参数服务器,其中,所述参数服务器被配置为在接收到更新基数计数器后,对与同一节点相关联的更新基数计数器和基数计数器进行去重合并,以作为更新后的基数计数器。
6.根据权利要求1-3中任一项所述的方法,还包括:
针对所述有向图数据,基于源节点标识,对具有相同源节点的尾节点进行聚合,以得到与每个源节点对应的尾节点集合,
并且其中,所述将所获取的基数计数器传送至与该源节点相关的所有尾节点包括:将所获取的基数计数器传送至与该源节点对应的尾节点集合中的所有尾节点。
7.根据权利要求1-3中任一项所述的方法,还包括:
将所述有向图数据划分为多组图数据;
其中,在每轮次迭代中执行所述迭代操作包括:在每轮次迭代中,并行地针对各组图数据执行所述迭代操作。
8.根据权利要求7所述的方法,其中,所述基于每个节点的节点信息初始化相关联的基数计数器包括:
并行地基于各组图数据中的每个节点的节点信息初始化相关联的基数计数器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111075644.3/1.html,转载请声明来源钻瓜专利网。