[发明专利]一种数据拼接方法、装置、电子设备和存储介质有效
申请号: | 201911128994.4 | 申请日: | 2019-11-18 |
公开(公告)号: | CN112817965B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 唐潜;朱建新;秦首科;姜振;张晓雨;郭玲;杨雷 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/23 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 拼接 方法 装置 电子设备 存储 介质 | ||
1.一种数据拼接方法,其特征在于,包括:
从至少两个数据分桶中为待拼接的目标数据选择目标分桶;
将所述目标数据分发到所述目标分桶的未拼接数据中,以指示所述目标分桶在监测到拼接触发事件时,对所述未拼接数据进行拼接;其中所述拼接触发事件根据所述目标分桶中的未拼接数据和已拼接数据生成。
2.根据权利要求1所述的方法,其特征在于,从至少两个数据分桶中为待拼接的目标数据选择目标分桶,包括:
根据待拼接的目标数据的分桶关键字值,确定所述目标数据的拼接方式;
若所述目标数据的拼接方式为批量拼接,则将所述分桶关键字值与候选分桶关键字和候选分桶之间的关联关系进行匹配,以得到所述目标分桶。
3.根据权利要求2所述的方法,其特征在于,确定所述目标数据的拼接方式之后,还包括:
若所述目标数据的拼接方式为实时拼接,则调用流式拼接服务将所述目标数据拼接入库。
4.根据权利要求1所述的方法,其特征在于,所述拼接触发事件根据数据拼接精度、所述目标分桶中的未拼接数据和已拼接数据生成。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括若任一数据分桶满足如下条件,则生成该数据分桶的拼接触发事件:
ve/(ve+vb)=1-α
其中ve为该数据分桶的未拼接数据量、vb为该数据分桶的已拼接数据量,α为所述数据拼接精度。
6.根据权利要求1所述的方法,其特征在于,所述数据分桶的大小根据最小拼接时间窗口和计算资源确定。
7.根据权利要求1所述的方法,其特征在于,所述数据分桶中的数据量随等待时间增长而收敛。
8.一种数据拼接装置,其特征在于,包括:
选择模块,用于从至少两个数据分桶中为待拼接的目标数据选择目标分桶;
分发拼接模块,用于将所述目标数据分发到所述目标分桶的未拼接数据中,以指示所述目标分桶在监测到拼接触发事件时,对所述未拼接数据进行拼接;其中所述拼接触发事件根据所述目标分桶中的未拼接数据和已拼接数据生成。
9.根据权利要求8所述的装置,其特征在于,所述选择模块包括:
拼接方式确定单元,用于根据待拼接的目标数据的分桶关键字值,确定所述目标数据的拼接方式;
目标分桶确定单元,用于若所述目标数据的拼接方式为批量拼接,则将所述分桶关键字值与候选分桶关键字和候选分桶之间的关联关系进行匹配,以得到所述目标分桶。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
实时拼接模块,用于若所述目标数据的拼接方式为实时拼接,则调用流式拼接服务将所述目标数据拼接入库。
11.根据权利要求8所述的装置,其特征在于,所述拼接触发事件根据数据拼接精度、所述目标分桶中的未拼接数据和已拼接数据生成。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括事件触发模块,用于:
若任一数据分桶满足如下条件,则生成该数据分桶的拼接触发事件:
ve/(ve+vb)=1-α
其中ve为该数据分桶的未拼接数据量、vb为该数据分桶的已拼接数据量,α为所述数据拼接精度。
13.根据权利要求8所述的装置,其特征在于,所述数据分桶的大小根据最小拼接时间窗口和计算资源确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911128994.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:承载标识的分配方法、装置、设备和存储介质
- 下一篇:一种金属制品切割装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置