[发明专利]流式数据处理方法、装置、电子设备及存储介质在审

专利信息
申请号: 201910953104.7 申请日: 2019-10-09
公开(公告)号: CN110716959A 公开(公告)日: 2020-01-21
发明(设计)人: 谢维柱;邢越 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F16/2455 分类号: G06F16/2455;G06F16/22;G06F12/02
代理公司: 11205 北京同立钧成知识产权代理有限公司 代理人: 胡艾青;刘芳
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据分片 运行状态 存储介质 存储容器 第一数据 溢出 数据处理 异常状态 流式 数据处理技术 缓存 电子设备 分开处理 缓存数据 数据缓存 数据下发 异常数据 整体处理 正常数据 算子 申请 存储
【说明书】:

本申请公开了一种流式数据处理方法、装置、电子设备及存储介质,涉及数据处理技术领域。具体实现方案为:先获取第一数据存储容器中各个数据分片对应的实例的运行状态,其中,第一数据存储容器包括多个数据分片,数据下发组件的缓存数据按照数据分片粒度存储在第一数据存储容器中,然后,根据运行状态确定溢出数据分片,溢出数据分片为运行状态为异常状态的实例所对应的数据分片,最后,将溢出数据分片中的数据缓存至存储介质中。本申请提供的流式数据处理方法,通过将运行状态为异常状态的实例所对应的数据分片缓存至存储介质中,从而将异常数据分片和正常数据分片分开处理,进而避免因某级算子实例短期异常,而造成整体处理能力下降。

技术领域

本申请涉及数据处理技术领域,尤其涉及一种流式数据处理方法、装置、电子设备及存储介质。

背景技术

随着服务器数据处理能力的发展,流式计算广泛应用于信息流、搜索建库、检索计费等大型分布式计算场景中。

其中,在流式计算中,当短时间内系统接收数据的速率高于它处理数据的速率时,系统通常情况将进行反压(backpressure)处理。对于造成反压的原因可能有如下两点:1、流量突增,超过系统处理能力;2、某级算子实例短期异常,处理能力下降。目前,现有技术中处理反压并没有区分上述两种情况,统一都是全部按照反压方式处理。

但是,如果是因为某级算子实例短期异常,处理能力下降,直接采用反压的方式,则无法隔离正常和异常实例,进而会造成流式计算算力以及内存的浪费。

发明内容

本申请提供一种流式数据处理方法、装置、电子设备及存储介质,以解决因某级算子实例短期异常,而造成的整体处理能力下降的问题。

第一方面,本申请提供一种流式数据处理方法,包括:

获取第一数据存储容器中各个数据分片对应的实例的运行状态,其中,所述第一数据存储容器包括多个数据分片,数据下发组件的缓存数据按照数据分片粒度存储在所述第一数据存储容器中;

根据所述运行状态确定溢出数据分片,所述溢出数据分片为所述运行状态为异常状态的实例所对应的数据分片;

将所述溢出数据分片中的数据缓存至存储介质中。

在本实施例中,通过将获取第一数据存储结构中各个数据分片对应的实例的运行状态,然后根据运行状态确定运行状态为异常状态的实例所对应溢出数据分片,再将溢出数据分片中的数据缓存至存储介质中,从而使得第一数据存储结构的数据可以按照数据分片粒度进行溢出,以将运行状态为异常状态的实例所对应的数据分片缓存至存储介质中,从而将异常数据分片和正常数据分片分开处理,进而避免因某级算子实例短期异常,而造成的整体处理能力下降的情况。

在一种可能的设计中,所述将所述溢出数据分片中的数据缓存至存储介质中,包括:

将数据单元中的数据缓存至所述存储介质的落盘数据文件中,所述溢出数据分片包括至少一个所述数据单元,所述数据单元按照预设数据结构进行数据存储。

在一种可能的设计中,所述预设数据结构包括数据标识符、数据记录单元以及落盘文件元信息,所述落盘文件元信息包括存储位置信息以及文件信息;

所述数据标识符为每条单元数据的唯一标识符;

所述数据记录单元用于存储所述单元数据中的数据,当将所述数据单元中的数据缓存至所述存储介质的落盘数据文件中时,所述数据单元为空单元;

所述存储位置信息为所述落盘数据文件的位置信息;

所述文件信息为所述单元数据中的数据在所述落盘数据文件中的位置信息。

在本实施例中,通过定于预设数据结构,建立数据分片中的标识符与落盘数据文件中所存储的数据的联系,从而便于后续的数据加载。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910953104.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top