[发明专利]Spark任务处理方法、装置、电子设备及存储介质有效

专利信息
申请号: 202010366884.8 申请日: 2020-04-30
公开(公告)号: CN111708799B 公开(公告)日: 2023-09-05
发明(设计)人: 吴庆双 申请(专利权)人: 咪咕文化科技有限公司;中国移动通信集团有限公司
主分类号: G06F16/242 分类号: G06F16/242;G06F16/2458;G06F16/27;G06F9/48
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 苗晓静
地址: 100032*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: spark 任务 处理 方法 装置 电子设备 存储 介质
【说明书】:

发明实施例公开了一种Spark任务处理方法、装置、电子设备及存储介质,方法包括:根据各待处理任务的优先级依次读取待处理任务;针对每个当前读取的待处理任务,根据Spark集群系统当前的运行状态、Spark集群系统当前可用资源以及当前读取的待处理任务所需的资源,判断是否执行当前读取的待处理任务,若是,则执行当前读取的待处理任务,并针对下一个待处理任务进行判断。本发明根据Spark集群系统的运行状态和当前可用资源以及当前待处理任务所需的资源,确定是否执行当前待处理任务,从而可以避免因排序在先的任务耗时过长、占用资源过多而导致排序在后但是需要较少资源的任务无法执行的问题,进而可以实现资源的优化分配。

技术领域

本发明涉及计算机技术领域,具体涉及一种Spark任务处理方法、装置、电子设备及存储介质。

背景技术

Spark是一个通用引擎,可用它来完成各种各样的运算,包括SQL查询、文本处理、机器学习等。在大数据系统中,经常采用Spark来完成各种大数据处理的需求。例如通过Spark来进行多个SQL查询统计任务,此时一般采取的措施是:在有多个任务待处理的情况下,spark-submit(Spark应用程序部署工具)会通过一个统一的main方法创建sparkcontext,在spark context中通过多线程同时提交多个任务运行,然后spark context接到这所有的任务之后,通过中央调度依次分配资源来执行各个任务,最终任务完成程序退出。或者是,通过增加多个main方法的方式,将多个任务分散在这些main方法中,这样可以同时创建多个spark context,由spark context自行调度分配任务的执行。

然而,这两种方案均存在相应的缺点:

对于通过一个统一的main方法创建spark context,在spark context中通过多线程同时提交多个任务运行的处理方式,在某些任务耗时长、占用资源多的情况下,或者是临时紧急需要某些任务的统计结果的情况下,无法动态调度,优先分配资源、优先执行该任务得到数据。只能按照原先设计的main方法中的任务顺序,依次申请资源、排队执行任务,不够灵活,无法满足实际需求。例如,当排序在先的某个任务耗时过长、占用资源过多的情况下,会导致排序在后但是需要较少资源的任务无法执行,因而无法实现资源的优化分配。又如,当需要临时执行某一紧急任务时,无法动态调度,优先执行该任务,因而不够灵活,无法满足实际需求。

而对于通过增加多个main方法,将多个任务分散在多个main方法的处理方式,由于一个任务对应一个main方法,因此会因为任务过多,分配过细,从而增加运维人员的维护成本。

发明内容

由于现有方法存在上述问题,本发明实施例提出一种Spark任务处理方法、装置、电子设备及存储介质。

第一方面,本发明实施例提供了一种Spark任务处理方法,包括:

根据各待处理任务的优先级依次读取待处理任务;

针对每个当前读取的待处理任务,根据Spark集群系统当前的运行状态、Spark集群系统当前可用资源以及当前读取的待处理任务所需的资源,判断是否执行当前读取的待处理任务,若是,则执行当前读取的待处理任务,并针对下一个待处理任务进行判断。

进一步地,所述的Spark任务处理方法,还包括:

若根据Spark集群系统当前的运行状态、Spark集群系统当前可用资源以及当前读取的待处理任务所需的资源,判断不执行当前读取的待处理任务,则直接针对下一个待处理任务进行判断。

进一步地,针对每个当前读取的待处理任务,根据Spark集群系统当前的运行状态、Spark集群系统当前可用资源以及当前读取的待处理任务所需的资源,判断是否执行当前读取的待处理任务,若是,则执行当前读取的待处理任务,并针对下一个待处理任务进行判断,具体包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司;中国移动通信集团有限公司,未经咪咕文化科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010366884.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top