[发明专利]Cube立方体的增量式构建方法、构建装置和构建系统在审
申请号: | 202211460619.1 | 申请日: | 2022-11-17 |
公开(公告)号: | CN115934710A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 江林刚;肖阳阳;祖李军;刘伟煜;王磊 | 申请(专利权)人: | 中国邮政储蓄银行股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/27;G06F16/2458 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 王晓玲 |
地址: | 100032*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | cube 立方体 增量 构建 方法 装置 系统 | ||
本申请提供了一种Cube立方体的增量式构建方法、构建装置和构建系统,该方法包括:获取目标起始时间、目标终止时间以及数据库中的Cube分片的起始时间和终止时间;确定第一目标Cube分片的起始时间是否满足第一预设条件,确定第一目标Cube分片的终止时间是否满足第二预设条件,第一目标Cube分片为Cube分片中的任意一个;在第一目标Cube分片的起始时间满足第一预设条件且第一目标Cube分片的终止时间满足第二预设条件的情况下,在数据库中将第一目标Cube分片删除,并按照第一目标Cube分片的起始时间和终止时间构建第二目标Cube分片,以存储待存储数据集。该方法解决了现有技术中无法重新构建已被合并的Cube片段的问题。
技术领域
本申请涉及多维数据分析领域,具体而言,涉及一种Cube立方体的增量式构建方法、构建装置、计算机可读存储介质和构建系统。
背景技术
在大数据分析领域,基于Kylin分析型数据仓库构建Cube是一种常用的解决方案。Kylin针对按自然周期分区存储和增长的星型模型/雪花模型数据集,提供了按相应自然周期构建CubeSegment的方法,称为增量式构建Cube。同时,Kylin会合并一些连续的CubeSegment以提高存储效率、减少跨片查询。然而,这种方式有以下两个缺点:
增量构建和自然周期有关,但合并和自然周期无关,合并只和个数有关,导致合并的一些CubeSegment不规整,部分场景反而增加了跨片查询。例如,按天增量构建Cube,可能出现本月靠前的某些天级别CubeSegment被合并进了上个月中,对本月进行分析查询时则会出现跨CubeSegment查询情况。
当需要重新构建某自然周期的CubeSegment,而其已被合并时,则直接报错,无法构建。
发明内容
本申请的主要目的在于提供一种Cube立方体的增量式构建方法、构建装置、计算机可读存储介质和构建系统,以解决现有技术中无法重新构建已被合并的Cube片段的问题。
根据本申请实施例的一个方面,提供了一种Cube立方体的增量式构建方法,所述Cube立方体为数据库中用于存储数据的数据结构,所述Cube立方体包括多个Cube分片,所述Cube分片的边界用起始时间和终止时间标记,一个所述Cube分片用于存储一个时间区间的数据集,所述方法包括:获取目标起始时间、目标终止时间以及所述数据库中的所述Cube分片的所述起始时间和所述终止时间,所述目标起始时间为待存储数据集对应的所述时间区间的起点,所述目标终止时间为所述待存储数据集对应的所述时间区间的终点;确定第一目标Cube分片的所述起始时间是否满足第一预设条件,确定所述第一目标Cube分片的所述终止时间是否满足第二预设条件,所述第一预设条件为所述第一目标Cube分片的所述起始时间小于或者等于所述目标起始时间,所述第二预设条件为所述第一目标Cube分片的所述终止时间大于或者等于所述目标终止时间,所述第一目标Cube分片为所述Cube分片中的任意一个;在所述第一目标Cube分片的所述起始时间满足第一预设条件且所述第一目标Cube分片的所述终止时间满足第二预设条件的情况下,在所述数据库中将所述第一目标Cube分片删除,并按照所述第一目标Cube分片的所述起始时间和所述终止时间构建第二目标Cube分片,以存储所述待存储数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国邮政储蓄银行股份有限公司,未经中国邮政储蓄银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211460619.1/2.html,转载请声明来源钻瓜专利网。