[发明专利]基于Hive的并行执行任务方法及装置有效
申请号: | 201410182326.0 | 申请日: | 2014-04-30 |
公开(公告)号: | CN103942099B | 公开(公告)日: | 2017-11-28 |
发明(设计)人: | 张永亮 | 申请(专利权)人: | 广州唯品会网络技术有限公司 |
主分类号: | G06F9/46 | 分类号: | G06F9/46;G06F17/30 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙)44288 | 代理人: | 汤喜友 |
地址: | 510370 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 hive 并行 执行 任务 方法 装置 | ||
1.基于Hive的并行执行任务方法,其特征在于,包括以下步骤:
步骤1、运行Hive脚本,所述Hive脚本中具有多条代码段;
步骤2、判断所述Hive脚本中存在启动执行命令还是模拟执行命令,若为启动执行命令,则对步骤3至步骤5进行启动执行;若为模拟执行命令,则对步骤3至步骤5进行模拟执行,并生成执行结果;
步骤3、识别出流程控制标签的顺序标记,所述流程控制标签位于所述Hive脚本中,并且每一个流程控制标签与对应的一代码段关联;
步骤4、将所有顺序标记进行比对,以得到代码段的执行顺序;
步骤5、根据所述执行顺序执行代码段,其中,对顺序标记相同的代码段进行并行执行。
2.如权利要求1所述的基于Hive的并行执行任务方法,其特征在于,步骤5之后还有以下步骤:
对每条代码段进行唯一标识,并将每条代码段的执行进度于一显示界面上进行显示,其中,所述唯一标识至少包括所述Hive脚本的脚本名称、与顺序标记对应的顺序号以及与顺序标记对应的代码段的子任务标识。
3.如权利要求2所述的基于Hive的并行执行任务方法,其特征在于,所述显示界面为Hadoop的jobTracker显示页面。
4.如权利要求1所述的基于Hive的并行执行任务方法,其特征在于,所述代码段包括至少一SQL语句。
5.基于Hive的并行执行任务装置,其特征在于,包括以下模块:
运行模块,用于运行Hive脚本,所述Hive脚本中具有多条代码段;
判断模块,判断所述Hive脚本中存在启动执行命令还是模拟执行命令,若为启动执行命令,则对识别模块至执行模块进行启动执行;若为模拟执行命令,则对识别模块至执行模块进行模拟执行,并生成执行结果;
识别模块,用于识别出流程控制标签的顺序标记,所述流程控制标签位于所述Hive脚本中,并且每一个流程控制标签与对应的一代码段关联;
比对模块,用于将所有顺序标记进行比对,以得到代码段的执行顺序;
执行模块,用于根据所述执行顺序执行代码段,其中,对顺序标记相同的代码段进行并行执行。
6.如权利要求5所述的基于Hive的并行执行任务装置,其特征在于,执行模块之后还有显示模块:
对每条代码段进行唯一标识,并将每条代码段的执行进度于一显示界面上进行显示,其中,所述唯一标识至少包括所述Hive脚本的脚本名称、与顺序标记对应的顺序号以及与顺序标记对应的代码段的子任务标识。
7.如权利要求6所述的基于Hive的并行执行任务装置,其特征在于,所述显示界面为Hadoop的jobTracker显示页面。
8.如权利要求5所述的基于Hive的并行执行任务装置,其特征在于,所述代码段包括至少一SQL语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州唯品会网络技术有限公司,未经广州唯品会网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410182326.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于联合收割机的导轨
- 下一篇:过滤式可调减压阀