[发明专利]基于Spark的Kafka消费并发处理方法及装置在审

专利信息
申请号: 201910857602.1 申请日: 2019-09-09
公开(公告)号: CN110618860A 公开(公告)日: 2019-12-27
发明(设计)人: 周朝卫 申请(专利权)人: 中盈优创资讯科技有限公司
主分类号: G06F9/48 分类号: G06F9/48
代理公司: 11127 北京三友知识产权代理有限公司 代理人: 周晓飞;谷敬丽
地址: 100872 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 切片 分区 并发处理 并行执行 并发
【说明书】:

发明提供了一种基于Spark的Kafka消费并发处理方法及装置,该方法包括:对Kafka的每个Topic分区进行切片,获得每个Topic分区的多个切片;确定每个Topic分区的每个切片对应的Spark任务,其中,每个切片对应的Spark任务用于消费该切片中的数据;并行执行每个Topic分区的多个切片对应的多个Spark任务。本发明可以实现并发消费Kafka数据,效率高。

技术领域

本发明涉及互联网领域,尤其涉及一种基于Spark的Kafka消费并发处理方法及装置。

背景技术

在现有的Kafka消费模型中,一个Kafka的Topic分区只能有一个消费者,图1为现有技术Kafka消费示意图,如图1所示,Kafka的某一Topic有4个分区(或称为4个Topic分区),如果给Spark分配了5个CPU Core(分别为core1、core2、core3、core4和core5),而Spark将启动与Kafka的Topic分区数相同的任务数,即最多同时执行4个Spark任务(task),每个CPU Core对应一个spark的task,则会剩余一个CPU Core不会消费任何数据。因此,现有的Kafka消费模型存在以下几个问题:第一,Spark的最大任务数与Kafka的Topic分区数相同,Kafka的每个Topic分区只能对应一个Spark任务,一个Topic分区的数据不能并发消费,剩余的Spark资源(CPU Core)不会消费Kafka数据,也不会释放,因此,消费Kafka数据的效率低且资源浪费;第二,增加Kafka分区数可以提高消费Kafka数据的并发度,但是增加分区数的操作非常困难,且不能无限增加,过多的Kafka分区会影响Kafka的容错能力,从异常中恢复的时间也会明显增加,同样效率不高。

发明内容

本发明实施例提出一种基于Spark的Kafka消费并发处理方法,用以实现并发消费Kafka数据,效率高,该方法包括:

对Kafka的每个Topic分区进行切片,获得每个Topic分区的多个切片;

确定每个Topic分区的每个切片对应的Spark任务,其中,每个切片对应的Spark任务用于消费该切片中的数据;

并行执行每个Topic分区的多个切片对应的多个Spark任务。

本发明实施例提出一种基于Spark的Kafka消费并发处理装置,用以实现并发消费Kafka数据,效率高,该装置包括:

切片模块,用于对Kafka的每个Topic分区进行切片,获得每个Topic分区的多个切片;

任务映射模块,用于确定每个Topic分区的每个切片对应的Spark任务,其中,每个切片对应的Spark任务用于消费该切片中的数据;

执行模块,用于并行执行每个Topic分区的多个切片对应的多个Spark任务。

本发明实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于Spark的Kafka消费并发处理方法。

本发明实施例还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述基于Spark的Kafka消费并发处理方法的计算机程序。

在本发明实施例中,对Kafka的每个Topic分区进行切片,获得每个Topic分区的多个切片;确定每个Topic分区的每个切片对应的Spark任务,其中,每个切片对应的Spark任务用于消费该切片中的数据;并行执行每个Topic分区的多个切片对应的多个Spark任务。在上述过程中,对Kafka的每个Topic分区进行切片,获得每个Topic分区的多个切片,因此可以并行执行每个Topic分区的多个切片对应的多个Spark任务,即每个Topic分区的数据可以并发消费,从而提高了消费Kafka数据的并发度,即提高了消费Kafka数据的效率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中盈优创资讯科技有限公司,未经中盈优创资讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910857602.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top