[发明专利]一种基于管道通信的MapReduce编程框架运算方法无效
申请号: | 201010556513.2 | 申请日: | 2010-11-24 |
公开(公告)号: | CN101996079A | 公开(公告)日: | 2011-03-30 |
发明(设计)人: | 伍之昂;曹杰;王有权 | 申请(专利权)人: | 南京财经大学 |
主分类号: | G06F9/44 | 分类号: | G06F9/44;G06F9/46 |
代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 陈扬 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于管道通信的MapReduce编程框架运算方法,该方法在Map任务和Reduce任务之间实现管道通信,避免将中间结果写入分布式文件系统,并使Map任务和Reduce任务并行化执行;该方法还提供了容错策略,Reduce任务将收到的数据存储到临时缓冲区,Map任务失败时,忽略它从管道发来的所有数据;Map任务将其发出去的数据暂时保存,Reduce任务失败时,将这些数据重新发送给复制的Reduce任务。本发明成果能节省布式文件系统的维护代价,大幅度缩短作业的执行时间,且具备健壮的容错性。 | ||
搜索关键词: | 一种 基于 管道 通信 mapreduce 编程 框架 运算 方法 | ||
【主权项】:
一种基于管道通信的MapReduce编程框架运算方法,其特征在于该运算方法利用SOCKET编程在Map任务和Reduce任务之间实现管道通信,具体步骤如下:1)Map任务初始化时打开SOCKET与Reduce任务建立通信管道,Map任务开始执行后,边执行边将输出的中间结果通过管道发给Reduce任务;Reduce任务同步接收来自于Map任务的数据,将这些数据存储到内存缓冲区中,Reduce在收到的部分数据的情况下,一旦满足其执行条件,Reduce基于部分输入数据开始执行;此时,Map任务尚未完成,Map任务和Reduce任务并行化执行;2)当所有Map任务都执行完毕时,Reduce任务合并来自于同一Map任务的数据,并继续执行直至完毕;若Reduce任务产生的中间数据还需要被下一轮的Map任务所使用,则Reduce任务将中间数据通过管道传送给Map任务;若Reduce任务产生的数据是最后结果,则Reduce任务将结果写入DFS。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京财经大学,未经南京财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010556513.2/,转载请声明来源钻瓜专利网。
- 上一篇:球形接头密封件
- 下一篇:拖拉机变速箱上的动力输出轴