[发明专利]一种图数据处理的方法、装置及系统有效
申请号: | 201611081960.0 | 申请日: | 2016-11-30 |
公开(公告)号: | CN108132838B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 夏应龙;徐建;夏命榛 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F16/27 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 系统 | ||
1.一种图数据处理的方法,其特征在于,包括:
主控节点获取图数据,所述图数据包括M个顶点和多条有方向的边,其中,每条边连接所述M个顶点中的两个顶点,且所述每条边的方向由所述两个顶点中的源顶点指向目的顶点,所述M为大于2的整数;
所述主控节点对所述图数据进行分割,以得到P个分片,其中,每个分片包括至少一个目标顶点的入边,所述入边为指向所述目标顶点的边,所述P个分片对应的目标顶点数量之和等于所述M,且所述每个分片对应的目标顶点互不相同,所述P为大于1的正整数,所述P个分片包括第一分片和第二分片;
所述主控节点从所述每个分片中确定出至少两个边集合;
所述主控节点将所述第一分片所包含的至少两个边集合调度到至少两个工作节点上以进行处理;
所述主控节点将所述第二分片中包含的关联边集合调度到所述至少两个工作节点上以进行处理;所述关联边集合是包含所述第一分片对应的目标顶点的出边的边集合,所述出边为从所述第一分片中的目标顶点指出的边。
2.根据权利要求1所述的方法,其特征在于,所述主控节点从所述每个分片中确定出至少两个边集合,包括:
所述主控节点将所述P个分片中边的数值按照边的方向填充到P行P列矩阵形式的数据结构中,以得到P2个数据块;
其中,每个数据块为一个边集合,所述每个分片包含至少两个数据块;所述P行P列矩阵是以所述M个顶点为横轴和纵轴形成的,所述横轴上的顶点为源顶点时,则所述纵轴上的顶点为目的顶点,或者所述横轴上的顶点为目的顶点时,则所述纵轴上的顶点为源顶点。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
所述主控节点为所述P2个数据块中的每个数据块设置一个唯一的块标识;
所述主控节点确定所述P2个数据块的块标识与多个工作节点之间的对应关系;
所述主控节点将所述第一分片所包含的至少两个边集合调度到所述至少两个工作节点上以进行处理,包括:
所述主控节点按照所述对应关系,将所述第一分片包含的至少两个数据块,调度到所述至少两个工作节点上以进行处理。
4.根据权利要求3所述的方法,其特征在于,所述主控节点将所述第二分片中包含的关联边集合,调度到所述至少两个工作节点上以进行处理,包括:
所述主控节点按照所述对应关系,将所述关联边集合对应的数据块调度到所述至少两个工作节点上以进行处理。
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
所述主控节点设置同步标记;
所述同步标记用于指示第一数据块所在的工作节点在处理完所述第一数据块之后与第二数据块所在的工作节点进行数据同步;其中,所述第一数据块为所述第一分片中按照调度顺序最后一个被调度的数据块,所述第二数据块为所述关联边集合对应的数据块中最后一个被调度的数据块。
6.根据权利要求1所述的方法,其特征在于,所述主控节点从所述每个分片中确定出至少两个边集合,包括:
所述主控节点确定所述每个分片中目标顶点的度数,所述度数表征所述目标顶点与其他顶点关联的紧密度;
当第一目标顶点的度数超过预设阈值时,所述主控节点将所述第一目标顶点的入边划分到同一边集合中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611081960.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分布式集群调度系统及方法
- 下一篇:一种资源调度方法及装置