[发明专利]一种高可靠分布式数据流实时统计方法及系统有效

申请号：	201710192864.1	申请日：	2017-03-28
公开（公告）号：	CN107193643B	公开（公告）日：	2019-11-05
发明（设计）人：	木伟民;李召希;王坤朋;王伟平	申请（专利权）人：	中国科学院信息工程研究所
主分类号：	G06F9/48	分类号：	G06F9/48;G06F9/54;G06F11/30
代理公司：	北京君尚知识产权代理有限公司 11200	代理人：	司立彬
地址：	100093 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种高可靠分布式数据流实时统计方法及系统。本发明包括三项技术，技术一为基于MapReduce编程模型的分布式数据流计算模型，将MapReducer模型的思想扩展到了集群概念上，每一Map或者Reducer计算单元都是分布式集群中的一节点，分别称作Mapper或Reducer，所有的Mapper节点组成Mapper集群，所有的Reducer节点组成Reducer集群；技术二为带序号的并发数据传递机制，技术三为基于状态与信号的分布式任务管理调度机制，其中技术一通过保证分布式系统的可扩展性，解决了吞吐量的问题；技术二和技术三分别解决了数据可靠性和任务可用性的问题，从而保证了可靠的语义。
搜索关键词：	一种可靠分布式数据流实时统计方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种高可靠分布式数据流实时统计方法，其步骤为：1)根据当前的统计任务生成分布式集群MapReducer的Map任务和Reducer任务；2)针对每个计算任务为Mapper集群中的每一Mapper节点初始化一Mapper序号、为Reducer集群中的每一Reducer节点初始化一Reducer序号；其中，Mapper序号初始化为Mapper集群已经在分布式缓存中生成的中间数据集个数；Reducer序号初始化为Reducer集群下一轮计算即将从分布式缓存中取得的中间数据集序号；3)Mapper集群中的Mapper节点根据当前的Mapper序号从消息中间件拉取消息并处理；其中，当一个Mapper节点处理完一个时间粒度的输入数据产生初步计算结果后，将Mapper序号自增1并把初步计算结果以自增后的Mapper序号存储在分布式缓存系统Redis中；4)Reducer集群从分布式缓存系统Redis中顺序读取所述初步计算结果并处理，得到当前统计任务的最终统计结果；其中，每个Reducer节点处理任务时，从分布式缓存系统Redis中得到Reducer序号，然后从分布式缓存系统Redis中读取该Reducer序号的数据；如果Reducer节点需要归并多个Reducer序号的数据集，则该Reducer节点保存增加后的Reducer序号，直到该多个Reducer序号的数据集处理完成后，将该Reducer节点的Reducer序号更新到分布式缓存系统Redis中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所，未经中国科学院信息工程研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710192864.1/，转载请声明来源钻瓜专利网。

上一篇：任务数据压缩切换方法、宜压缩程度评价方法及相关装置
下一篇：一种业务消息处理方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种高可靠分布式数据流实时统计方法及系统有效

专利文献下载