[发明专利]一种用于对大数据任务进行分布式处理的方法有效
申请号: | 201710568167.1 | 申请日: | 2017-07-13 |
公开(公告)号: | CN107370808B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 袁敏 | 申请(专利权)人: | 盐城工学院 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F9/48 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 224051 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 数据 任务 进行 分布式 处理 方法 | ||
本发明涉及一种用于对大数据任务进行分布式处理的方法,所述方法包括:确定针对大数据任务的任务处理次序,所述任务处理次序包括组间次序和组内次序;所述组间次序用于指示网络节点所在的组的次序,所述组内次序用于指示网络节点在其所属的组中的次序;根据至少两个网络节点各自对应的任务处理次序,确定所述至少两个网络节点中的要进行任务处理的网络节点,所述至少两个网络节点中任务处理次序低的网络节点的全部或部分任务依赖于至少一个任务处理次序高的网络节点;以及向所述要进行任务处理的网络节点发送任务处理指示,所述任务处理指示用于指示所述要进行任务处理的网络节点开始处理任务。
技术领域
本发明涉及分布式系统领域,并且更具体地涉及一种用于对大数据任务进行分布式处理的方法。
背景技术
目前,大数据平台技术框架支持的开发语言多种多样,开发人员的背景差异也很大,这就产生出大数据任务包括很多不同类型的子任务运行在大数据平台之上的情况,如:MapReduce、Hive、Pig、Spark、Java、Shell、Python等。
通常,这些子任务需要不同的运行环境,并且除了定时运行,各种类型之间的任务存在依赖关系。目前各业务的数据任务基本都是靠Crontab定时调度,各个任务之间的依赖仅靠简单的串行来实现。这样做的问题:很容易造成前面的任务未结束或者失败,后面的任务也运行起来,最终跑出错误的分析结果;任务不能并发执行,增加任务执行的整体时间窗口;任务管理和维护很不方便,不好统计任务的执行时间及运行日志;以及缺乏及时有效的告警。
发明内容
根据本发明的一个方面,提供一种用于对大数据任务进行分布式处理的设备,设备包括:
次序分配单元,用于确定针对大数据任务的任务处理次序,任务处理次序包括组间次序和组内次序;组间次序用于指示网络节点所在的组的次序,组内次序用于指示网络节点在其所属的组中的次序;其中,组间次序低的组中包含的网络节点的全部或部分任务依赖于至少一个组间次序高的组中包含的网络节点;在同一组内,组内次序低的网络节点的全部或部分任务依赖于至少一个组内次序高的网络节点;
任务指定单元,用于根据至少两个网络节点各自对应的任务处理次序,确定至少两个网络节点中的要进行任务处理的网络节点,至少两个网络节点中任务处理次序低的网络节点的全部或部分任务依赖于至少一个任务处理次序高的网络节点;以及控制单元,用于向要进行任务处理的网络节点发送任务处理指示,任务处理指示用于指示要进行任务处理的网络节点开始处理任务。
优选地,任务指定单元,用于当接收到至少两个网络节点中的请求网络节点发送的任务处理请求时,查询至少一个目标组,至少一个目标组是尚未完成任务处理的各个组中组间次序最高的组;获取任务处理列表,任务处理列表中包含每一个目标组中尚未完成任务处理的各个网络节点中、组内次序最高的至少一个网络节点;检测请求网络节点是否存在于任务处理列表中;若请求网络节点存在于任务处理列表中,则确定请求网络节点为要进行任务处理的网络节点。
优选地,任务指定单元,用于当接收到至少两个网络节点中的请求网络节点发送的任务处理请求时,查询请求网络节点的组间次序和组内次序;检测请求网络节点的组间次序是否为至少两个网络节点中尚未完成任务处理的各个网络节点的组间次序中的最高次序;若请求网络节点的组间次序是至少两个网络节点中尚未完成任务处理的各个网络节点的组间次序中的最高次序,则检测请求网络节点的组内次序是否为请求网络节点所在组内尚未完成任务处理的各个网络节点的组内次序中的最高次序;若请求网络节点的组内次序是请求网络节点所在组内尚未完成任务处理的各个网络节点的组内次序中的最高次序,则确定请求网络节点为要进行任务处理的网络节点。
优选地,任务指定单元,用于查询至少一个目标组,目标组是尚未完成任务处理的各个组中、组间次序最高的组;对于至少一个目标组中的每一个目标组,将目标组中尚未完成任务处理的各个网络节点中、组内次序最高的至少一个网络节点确定为要进行任务处理的网络节点。
优选地,系统还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盐城工学院,未经盐城工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710568167.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置