[发明专利]基于分布式计算框架的全局排序输出系统及其方法有效

专利信息
申请号: 202011413983.3 申请日: 2020-12-07
公开(公告)号: CN112540985B 公开(公告)日: 2023-09-26
发明(设计)人: 孙振 申请(专利权)人: 江苏赛融科技股份有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/27
代理公司: 北京同辉知识产权代理事务所(普通合伙) 11357 代理人: 廖娜
地址: 210000 江苏省南京市浦口区浦滨*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 分布式 计算 框架 全局 排序 输出 系统 及其 方法
【说明书】:

发明涉及一种基于分布式计算框架的全局排序输出系统及其方法,采用分布式计算框架,其内设置有节点排序暂存模块、共识数据排序模块、数据同步输出模块。通过节点排序暂存模块用于数据排序,通过共识数据排序模块,将排序后的数据传递到下一个步骤,通过数据同步输出模块,将数据输出至目标库表。由此,各个节点通过共识轮询全局数据排序,不需要依赖分布式文件系统进行全局排序,简化了系统的复杂度。不需要将数据集中起来处理,降低了内存、CPU等资源消耗。整个排序过程耗时少,处理效率高,能更快的写入目标库表,提高用户体验。减少网络消耗,降低分布式计算框架资源消耗。

技术领域

本发明涉及一种排序输出系统及其方法,尤其涉及一种基于分布式计算框架的全局排序输出系统及其方法。

背景技术

在现有分布式计算框架中,默认结果输出到目标库表是无序的,如果用户设定了排序规则也只是在各个节点内进行数据结果排序,最后输出也是各个节点的无序输出到目标库表。

同时,在数据处理过程中需要依赖分布式文件系统进行数据汇聚排序,不仅增加组件而且汇聚及输出效率比较低。

具体来说,主要体现在以下几个方面的缺点:

1、各个节点首先需要将计算完成的数据,通过分布式文件系统将各个节点数据汇集成一个临时文件。此方法对数据量,网络,分布式文件系统性能异常敏感,某一点有问题就会造成性能极度下降。

2、文件汇集完成后需要读取文件内容进行排序,导致分布式文件系统压力巨大,资源消耗多,时间长。

3、排序完成后,分布式计算节点中某个节点需要重新通过分布式文件系统读取排序后的汇聚文件。这样会导致网络及分布式计算节点资源消耗大,性能低下,耗时长。

有鉴于上述的缺陷,本设计人,积极加以研究创新,以期创设一种基于分布式计算框架的全局排序输出系统及其方法,使其更具有产业上的利用价值。

发明内容

为解决上述技术问题,本发明的目的是提供一种基于分布式计算框架的全局排序输出系统及其方法。

本发明的基于分布式计算框架的全局排序输出系统,其中:采用分布式计算框架,其内设置有节点排序暂存模块,用于与本地文件系统通讯;还包括有共识数据排序模块;用于在排序完成后批量输出数据量的数据交给下个节点,还包括有数据同步输出模块,用于将输出节点输出至目标库表。

基于分布式计算框架的全局排序输出方法,其中:

步骤一,通过节点排序暂存模块用于数据排序;

步骤二,通过共识数据排序模块,将排序后的数据传递到下一个步骤;

步骤三,通过数据同步输出模块,将数据输出至目标库表。

进一步地,上述的基于分布式计算框架的全局排序输出方法,其中,所述步骤一中,通过节点排序暂存模块,将各个节点内的数据排序并保存到节点所在本地文件系统。

更进一步地,上述的基于分布式计算框架的全局排序输出方法,其中,所述步骤一中,各个节点依赖分布式计算框架数据读取机制,读取属于自己的数据块,采用边读取边存储的方式,通过临时文件暂存于各个节点本地文件系统,然后加载暂存的临时文件至节点内存,根据用户设定的排序字段进行增序或降序排序,将排序完的数据保存为另一份临时文件,保存至节点本地文件系统。

更进一步地,上述的基于分布式计算框架的全局排序输出方法,其中,所述步骤二中,将分布式计算框架中参与计算的各个节点,通过节点共识的方法,轮番取出批量输出数据量的数据,交给下个节点;

同时,本节点也取出相同量数据进行排序,排序完成后取出批量输出数据量的数据交给下个节点;

循环直至最后一个节点完成后,将最终结果广播至每个节点;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏赛融科技股份有限公司,未经江苏赛融科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011413983.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top