[发明专利]一种流数据处理方法及装置有效
申请号: | 201811573256.6 | 申请日: | 2018-12-21 |
公开(公告)号: | CN111355689B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 王磊;丁岩;鲍焱 | 申请(专利权)人: | 金篆信科有限责任公司 |
主分类号: | H04L67/10 | 分类号: | H04L67/10;H04L65/60 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 孟德栋 |
地址: | 100176 北京市大兴区北京经济技术开发区科谷一*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
本申请涉及一种流数据处理方法,包括:将多个相同的流数据并行接入计算集群中,多个流数据与计算集群中的多个计算节点组一一对应;对多个流数据中的各流数据分别进行分流处理,得到与流数据相对应的多个子流数据;将与流数据相对应的多个计算过程划分为多个计算过程组,多个计算过程组与多个流数据一一对应;将多个子流数据分别输入到计算节点组中的至少一个计算节点上,以在计算节点上对子流数据执行计算过程组对应的数据处理过程,完成对多个流数据的并行处理。采用本申请实施例,能够降低对流数据进行处理的耗时,从而提高对流数据进行处理的效率。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种流数据处理方法及装置。
背景技术
目前,对于具有流数据量大、计算过程规模大、计算实时性要求高等特点的流数据处理情景,通常需要采用分布式计算处理的方式对流数据进行处理。
在对流数据进行分布式计算处理的过程中,可以流数据的一个规模较小的计算过程为基础,依次在分布式计算系统中的各个节点上进行计算,且在每一个节点上全量的参与另一个节点的计算。
但是,在流数据量增大、流数据的计算过程规模变大的情况下,上述处理机制的计算耗时会增加,同时分布式计算系统中的节点的数据处理能力可能会无法满足处理需求,从而降低对流数据处理的效率。
因此,需要一种流数据处理方法,以能够降低对流数据进行处理的耗时,从而提高对流数据处理的效率。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种流数据处理方法及装置,以能够降低对流数据进行处理的耗时,从而提高对流数据进行处理的效率。
有鉴于此,第一方面,本发明实施例提供了一种流数据处理方法,包括:
将多个相同的流数据并行接入计算集群中,多个所述流数据与所述计算集群中的多个计算节点组一一对应;
对多个所述流数据中的各所述流数据分别进行分流处理,得到与所述流数据相对应的多个子流数据;
将与所述流数据相对应的多个计算过程划分为多个计算过程组,所述多个计算过程组与多个所述流数据一一对应;
将所述多个子流数据分别输入到所述计算节点组中的至少一个计算节点上,以在计算节点上对子流数据执行计算过程组对应的数据处理过程,完成对多个所述流数据的并行处理。
第二方面,本发明实施例提供了一种流数据处理装置,包括:
接入模块,用于将多个相同的流数据并行接入计算集群中,多个所述流数据与所述计算集群中的多个计算节点组一一对应;
分流模块,用于对多个所述流数据中的各所述流数据分别进行分流处理,得到与所述流数据相对应的多个子流数据;
划分模块,用于将与所述流数据相对应的多个计算过程划分为多个计算过程组,所述多个计算过程组与多个所述流数据一一对应;
处理模块,将所述多个子流数据分别输入到所述计算节点组中的至少一个计算节点上,以在计算节点上对子流数据执行计算过程组对应的数据处理过程,完成对多个所述流数据的并行处理。
第三方面,本发明实施例还提了一种流数据处理装置,包括:
至少一个处理器、存储器、至少一个网络接口和用户接口;
所述至少一个处理器、存储器、至少一个网络接口和用户接口通过总线系统耦合在一起;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如第一方面所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金篆信科有限责任公司,未经金篆信科有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811573256.6/2.html,转载请声明来源钻瓜专利网。