[发明专利]分布式计算方法和装置有效
申请号: | 201310337312.7 | 申请日: | 2013-08-05 |
公开(公告)号: | CN103399927B | 公开(公告)日: | 2016-11-02 |
发明(设计)人: | 张健;叶青 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F9/44 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成;张大威 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 计算方法 装置 | ||
1.一种分布式计算方法,其特征在于,包括以下步骤:
根据输入数据生成输入向量Vector;
获取预设算子和所述预设算子对所述Vector的依赖关系;以及
通过映射模块Map组织多次map计算直至达到所述预设算子的终止条件为止,其中,每次map计算时根据所述依赖关系从所述Vector中获取数据以根据所述预设算子进行计算,并根据计算结果更新所述Vector中对应的数据。
2.根据权利要求1所述的方法,其特征在于,所述每次map计算时根据所述依赖关系从所述Vector中获取数据以根据所述预设算子进行计算,具体包括:
在每次计算时通过所述Map根据所述依赖关系获取所述预设算子在所述Vector中对应的至少部分输入数据,并根据所述预设算子对所述至少部分输入数据进行计算。
3.根据权利要求1或2所述的方法,其特征在于,还包括:
创建全局向量Var,其中,所述Var存储全局性的统计数据。
4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:
通过Emit接口将计算结果倒入至目的向量Vector/Var中。
5.根据权利要求1或2所述的方法,其特征在于,所述Vector分布式存储所述输入数据。
6.根据权利要求5所述的方法,其特征在于,所述Vector包括多个分割区Partition,每个所述Partition分别对应一个计算节点,每个所述Partition包括多个子节点SubNode。
7.根据权利要求6所述的方法,其特征在于,每个所述SubNode分别对应一个进程缓存,每个所述进程缓存分别对应一个线程缓存,以使得数据的传递方向为所述线程缓存、所述进程缓存至所述SubNode。
8.一种分布式计算装置,其特征在于,包括:
生成模块,用于根据输入数据生成输入向量Vector;
获取模块,用于获取预设算子和所述预设算子对所述Vector的依赖关系;以及
计算模块,用于通过映射模块Map组织多次map计算直至达到所述预设算子的终止条件为止,其中,每次map计算时根据所述依赖关系从所述Vector中获取数据以根据所述预设算子进行计算,并根据计算结果更新所述Vector中对应的数据。
9.根据权利要求8所述的装置,其特征在于,所述计算模块还具体用于在每次计算时通过所述Map根据所述依赖关系获取所述预设算子在所述Vector中对应的至少部分输入数据,并根据所述预设算子对所述至少部分输入数据进行计算。
10.根据权利要求8或9所述的装置,其特征在于,所述生成模块还用于创建全局向量Var,其中,所述Var存储全局性的统计数据。
11.根据权利要求8-10任一项所述的装置,其特征在于,所述计算模块还用于通过Emit接口将计算结果倒入至目的向量Vector/Var中。
12.根据权利要求8或9所述的装置,其特征在于,所述Vector分布式存储所述输入数据。
13.根据权利要求12所述的装置,其特征在于,所述Vector包括多个分割区Partition,每个所述Partition分别对应一个计算节点,每个所述Partition包括多个子节点SubNode。
14.根据权利要求13所述的装置,其特征在于,每个所述SubNode分别对应一个进程缓存,每个所述进程缓存分别对应一个线程缓存,以使得数据的传递方向为所述线程缓存、所述进程缓存至所述SubNode。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310337312.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:儿童自动安全门挡
- 下一篇:一种基于水文数据的降雨多维分析系统及其实现方法