[发明专利]在连接操作中管理数据倾斜的系统、方法和设备在审
| 申请号: | 201980044403.7 | 申请日: | 2019-06-11 | 
| 公开(公告)号: | CN112400164A | 公开(公告)日: | 2021-02-23 | 
| 发明(设计)人: | 弗洛里安·安德里亚斯·芬克;蒂埃里·克吕安斯;本诺特·戴奇维勒;马尔辛·祖科夫斯基 | 申请(专利权)人: | 斯诺弗雷克公司 | 
| 主分类号: | G06F16/00 | 分类号: | G06F16/00;G06F21/60 | 
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李琰;杨明钊 | 
| 地址: | 美国加利*** | 国省代码: | 暂无信息 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 连接 操作 管理 数据 倾斜 系统 方法 设备 | ||
1.一种用于管理数据倾斜的方法,所述方法包括:
计算连接操作的哈希值;
在所述连接操作的运行时使用轻量级略图数据结构来检测所述连接操作的探查侧上的数据倾斜;
在所述连接操作的探查阶段期间在所述连接操作的探查侧上标识频繁探查侧连接关键字;
标识具有与所述频繁探查侧连接关键字相对应的构建侧连接关键字的频繁构建侧行;以及
异步地将所述频繁构建侧行分配给一个或更多个远程服务器。
2.根据权利要求1所述的方法,其中,所述一个或更多个远程服务器被配置为:
异步接收所述频繁构建侧行;以及
为所述频繁构建侧行生成单独的哈希表。
3.根据权利要求1所述的方法,还包括:
选择包括所述连接操作的多个行的行集;以及
使用所述连接操作的所述哈希值将所述行集的所述多个行中的每一行探查到空间节省算法中。
4.根据权利要求3所述的方法,还包括:
基于传入数据更新所述空间节省算法;以及
对于所述空间节省算法的每次更新,作为更新所述空间节省算法的附带作用,标识指示所述频繁探查侧连接关键字被探查到的频繁程度的频率。
5.根据权利要求4所述的方法,其中,异步地将所述频繁构建侧行分配给所述一个或更多个远程服务器包括:
响应于所述频率超过预定阈值,异步地将所述频繁构建侧行分配给所述一个或更多个远程服务器;以及
响应于所述频率不超过所述预定阈值,将所述频繁构建侧行保留在当前服务器上。
6.根据权利要求3所述的方法,还包括:
计算已被探查到所述空间节省算法中的所述连接操作的总行数;
基于已被探查到所述空间节省算法中的所述连接操作的总行数,计算每个工作线程的阈值;以及
基于每个工作线程的阈值,确定所述频繁构建侧连接关键字在至少一个服务器的所有线程中是否频繁。
7.根据权利要求1所述的方法,其中,异步地将所述频繁构建侧行分配给所述一个或更多个远程服务器包括以下之一:
向多个可用的远程服务器中的每个远程服务器广播所述频繁构建侧行;或
仅将所述频繁构建侧行广播到频繁传输所述频繁构建侧连接关键字的一个或更多个远程服务器。
8.根据权利要求1所述的方法,还包括:更改服务器的输入链路,以将包括所述频繁探查侧连接关键字的频繁探查侧行路由到所述连接操作的本地实例,使得网络流量减少。
9.根据权利要求1所述的方法,其中,仅在达到以阈值置信度确定所述频繁探查侧连接关键字在服务器上是频繁的之后,才会发生将所述频繁构建侧行异步地分配给所述一个或更多个远程服务器。
10.根据权利要求3所述的方法,其中,所述轻量级略图数据结构包括哈希表空间节省算法。
11.一种存储指令的非暂时性计算机可读存储介质,所述指令在由一个或更多个处理器执行时,使所述一个或更多个处理器:
计算连接操作的哈希值;
在所述连接操作的运行时使用轻量级略图数据结构来检测所述连接操作的探查侧上的数据倾斜;
在所述连接操作的探查阶段期间在所述连接操作的探查侧上标识频繁探查侧连接关键字;
标识具有与所述频繁探查侧连接关键字相对应的构建侧连接关键字的频繁构建侧行;以及
异步地将所述频繁构建侧行分配给一个或更多个远程服务器。
12.根据权利要求11所述的非暂时性计算机可读存储介质,其中,所述指令还使所述一个或更多个处理器:
选择包括所述连接操作的多个行的行集;以及
使用所述连接操作的所述哈希值将所述行集的所述多个行中的每一行探查到空间节省算法中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯诺弗雷克公司,未经斯诺弗雷克公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980044403.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
 - 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
 - 数据发送方法、数据发送系统、数据发送装置以及数据结构
 - 数据显示系统、数据中继设备、数据中继方法及数据系统
 - 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
 - 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
 - 数据发送和数据接收设备、数据发送和数据接收方法
 - 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 





