[发明专利]基于多数据架构中心面向数据密集型应用的并行编程方法在审

专利信息
申请号: 201210359600.8 申请日: 2012-09-24
公开(公告)号: CN102880510A 公开(公告)日: 2013-01-16
发明(设计)人: 王力哲 申请(专利权)人: 中国科学院对地观测与数字地球科学中心
主分类号: G06F9/46 分类号: G06F9/46;G06F9/50
代理公司: 北京纽乐康知识产权代理事务所 11210 代理人: 覃莉
地址: 100094*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 多数 架构 中心 面向 数据 密集型 应用 并行 编程 方法
【权利要求书】:

1.一种基于多数据架构中心面向数据密集型应用的并行编程方法,其特征在于,包括以下步骤:

1)构建系统架构的主节点,接收用户提交的若干作业,并通过主节点将所述作业分割成相对应的次一级任务,并将所述次一级任务分布到子节点上;

2)构建系统架构的子节点,所述子节点包括任务跟踪程序TaskTracker服务器、作业跟踪程序、I/O服务器程序和网络共享程序;

3)将MapReduce应用及其配置置于网络的共享位置中,供机群中的所有计算节点访问共享位置中的作业,并加以执行;以及

4)设计自动加载MapReduce作业并行处理模型,所述并行处理模型包括提交作业、作业初始化、任务分配、任务定位、任务提交、任务执行和释放资源功能。

2.根据权利要求1所述的一种基于多数据架构中心面向数据密集型应用的并行编程方法,其特征在于:所述主节点包括元数据Metadata服务器和作业跟踪程序JobTracker服务器,所述元数据Metadata服务器使用Gfarm文件系统未经修改的元数据服务器,元数据服务器管理分布在多个机群上的文件,决定文件的实际位置,管理文件的复制,协调多个客户对文件的访问;元数据服务器还管理用户访问控制信息,所述作业跟踪程序JobTracker服务器使用一个数据感知的调度器,在考虑数据所在位置的基础上,将计算任务分布到多个机群中。

3.根据权利要求2所述的一种基于多数据架构中心面向数据密集型应用的并行编程方法,其特征在于:所述任务跟踪程序TaskTracker服务器负责接收和执行分布式资源管理应用接口DRMAA Gfarm Plugin送来的任务,所述作业跟踪程序使用一个分布式资源管理应用接口DRMAA的java库进行任务提交。

4.根据权利要求3所述的一种基于多数据架构中心面向数据密集型应用的并行编程方法,其特征在于:;所述子节点上的I/O服务器管理存储在子节点中的数据,所述主节点上的I/O服务器将数据存储在机群的高性能文件系统中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院对地观测与数字地球科学中心,未经中国科学院对地观测与数字地球科学中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210359600.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top