[发明专利]一种批处理数据分片方法、系统、计算机设备及存储介质在审
| 申请号: | 202110161596.3 | 申请日: | 2021-02-05 |
| 公开(公告)号: | CN112988343A | 公开(公告)日: | 2021-06-18 |
| 发明(设计)人: | 刘胜平;崔俊荣;韩美荣 | 申请(专利权)人: | 开店宝科技集团有限公司 |
| 主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50;G06F9/54;G06F16/2455 |
| 代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 杨用玲 |
| 地址: | 201210 上海市浦东新区中*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 批处理 数据 分片 方法 系统 计算机 设备 存储 介质 | ||
本发明提供了一种批处理数据分片方法、系统、计算机设备及存储介质,其方法包括步骤:在客户端启动时,注册服务到Zookeeper;接收所述Zookeeper对新注册的消息发送的广播;查询所述Zookeeper更新后的节点列表;获得所述客户端对应的节点在所述节点列表中的当前排序位置,以及总注册数量;根据所述当前排序位置以及所述总注册数量,计算获得所述客户端对应的分片系数。该方案通过Zookeeper,能够实现批处理数据分片的动态、实时扩容,从而能够提高批处理任务的执行效率,有利于降低开发接入成本和开发难度。
技术领域
本发明涉及数据分片技术领域,尤指一种批处理数据分片方法、系统、计算机设备及存储介质。
背景技术
Zookeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。Zookeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。
随着现在分布式系统应用越来越广泛,且处理的数据量也越来越大,在传统模式中处理批处理的任务往往都是单机部署,这样的话就会存在瓶颈,不利于提高批处理任务的执行效率。因此,需要一种基于Zookeeper,能够支持动态、实时扩容,以提高批处理任务执行效率的批处理数据分片方法。
发明内容
本发明的目的是提供一种批处理数据分片方法、系统、计算机设备及存储介质,该方案通过Zookeeper,能够实现批处理数据分片的动态、实时扩容,从而能够提高批处理任务的执行效率,有利于降低开发接入成本和开发难度。
本发明提供的技术方案如下:
本发明提供一种批处理数据分片方法,包括步骤:
在客户端启动时,注册服务到Zookeeper;
接收所述Zookeeper对新注册的消息发送的广播;
查询所述Zookeeper更新后的节点列表;
获得所述客户端对应的节点在所述节点列表中的当前排序位置,以及总注册数量;
根据所述当前排序位置以及所述总注册数量,计算获得所述客户端对应的分片系数。
在客户端启动时,通过SDK注册服务到Zookeeper,Zookeeper能够根据新的注册服务更新节点列表,并对新注册的消息发送广播,SDK在接收到广播后能够查询Zookeeper更新后的节点列表,从而确定客户端对应的节点在节点列表中的当前排序位置,以及总注册数量,根据当前排序位置以及总注册数量,便能够计算获得客户端对应的分片系数,从而达到数据分片的效果。本方案通过Zookeeper,能够实现批处理数据分片的动态、实时扩容,从而提高批处理任务的执行效率,有利于降低开发接入成本和开发难度。
进一步地,所述的在客户端启动时,注册服务到Zookeeper,具体包括:
初始化Zookeeper连接;
通过开源框架与所述Zookeeper建立连接;
监听所述Zookeeper中的自定义持久节点的实时状况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于开店宝科技集团有限公司,未经开店宝科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110161596.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种仪器仪表的密封设备
- 下一篇:一种基于声纹信号检测燃机故障的识别方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





