[发明专利]一种支持大规模动态图数据查询的并行处理框架的设计方法有效

专利信息
申请号: 201711034642.3 申请日: 2017-10-30
公开(公告)号: CN107807983B 公开(公告)日: 2021-08-24
发明(设计)人: 宋宝燕;王俊陆;单晓欢;丁琳琳;张毅隆;尹东晓 申请(专利权)人: 辽宁大学
主分类号: G06F16/27 分类号: G06F16/27;G06F16/28
代理公司: 沈阳杰克知识产权代理有限公司 21207 代理人: 娄华
地址: 110000 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 支持 大规模 动态 数据 查询 并行 处理 框架 设计 方法
【权利要求书】:

1.一种支持大规模动态图数据查询的并行处理框架的设计方法,其特征在于,设计方法如下:该并行处理框架结合了MapReduce框架和BSP框架,以Hadoop框架为底层基础,采取“MapReduce+BSP”模式来满足图计算数据量大和多次迭代的需求,在HDFS分布式文件系统的基础上对Hadoop核心源码包进行部分修改,保留了Hadoop框架原有的分布式文件系统、主从集群架构模式、RPC通信机制、容错控制机制、任务调度机制,同时该并行处理框架通过构建迭代控制模块JobTracker、构建实时监听模块、Map阶段功能设计、Reduce阶段功能设计来实现实时监控功能来检查图文件的动态变化以及实现BSP迭代控制、Hadoop实时监听、MapReduce框架优化。

2.如权利要求1所述的一种支持大规模动态图数据查询的并行处理框架的设计方法,其特征在于具体设计方法如下:

步骤1 构建JobTracker迭代控制模块:用户在提交作业时,通过实现迭代控制接口及相应图处理算法的迭代收敛条件来完成框架的迭代控制功能;

步骤2 构建监听进程模块:监听进程模块作为单独的一个进程来运行,与JobTracker进程同时启动,负责实时监控HDFS分布式文件系统的文件变化,通过设定相应的路径和时间间隔,来采取轮询机制定时监控固定的文件输入目录是否发生变化,从而实现处理动态图算法的功能;

步骤3 Map阶段功能设计:Mapper将会从执行完毕的Reducer本地缓存文件目录中拷贝待处理文件,并且与TaskTracker保持通信,按照相应命令进行处理下一轮迭代任务;

步骤4 Reduce阶段功能设计:框架针对图处理多次迭代的特点,Reduce阶段结束后会将中间结果写到本地磁盘系统而非HDFS文件系统,等到作业中所有迭代任务完成后,再将最终结果写入到HDFS中,最终清除缓存目录,完成作业。

3.按照权利要求1或2所述的一种支持大规模动态图数据查询的并行处理框架的设计方法,其特征在于所述JobTracker迭代控制模块的构建方法如下:

步骤1-1 初始化JobTracker

JobTracker模块通过脚本命令start-mapred.sh进行启动,JobTracker进程启动后,会通过调用offerService()方法启动一些监听线程来跟踪作业的状态并及时向JobTracker反馈;jobQueueJobInProgressListener用来跟踪各个JobInProgress实例在作业执行过程中的改变;eagerTaskInitializationListener不断监听Job初始化队列;

步骤1-2 RPC通信机制和心跳机制

首先,TaskTracker在初始化时会执行run()方法来与JobTracker建立连接,JobTracker接收到TaskTracker发送过来的心跳信息后,首先检查心跳信息是否来自于合法的TaskTracker节点,然后根据status、acceptNewTasks、responseId参数来获得TaskTracker的状态信息、心跳编号,处理发送过来的心跳信息,最后,TaskTracker接收到JobTracker发送回来的响应信息后,通过调用getActions方法获得TaskTrackerAction数组中的命令,进行下一轮的迭代任务;

步骤1-3 清理本地临时文件

当loopListener线程发来迭代结束的标志位信息时,JobTracker会实例化Task类中的NewDirectOutputCollector对象,将最后结果直接输出到HDFS分布式文件系统,同时将JobCleanup任务返回给TaskTracker执行,进行清理本地系统的临时文件。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁大学,未经辽宁大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711034642.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top