[发明专利]一种数据仓库的存储方法及装置有效
申请号: | 201611056644.8 | 申请日: | 2016-11-25 |
公开(公告)号: | CN108108374B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 李欢;崔宝宏 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/23;G06F16/28 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据仓库 存储 方法 装置 | ||
1.一种数据仓库的存储方法,包括:
将所述数据仓库中的操作性数据以预定周期为间隔保存为快照存储;
将每个所述快照存储以拉链方式整合生成细节数据层并进行存储;
将每个所述快照存储以拉链方式整合生成细节数据层并进行存储的步骤包括:
将所述快照存储分别存储在用于区分闭链数据和有效数据的pdata_status物理分区以及用于文件裁剪的pend_date物理分区。
2.根据权利要求1所述的方法,将所述数据仓库中的操作性数据以预定周期为间隔保存为快照存储包括:
根据业务特点对于面向业务的操作性数据采取增量或全量的抽取方式。
3.根据权利要求1所述的方法,将每个所述快照存储以拉链方式整合生成细节数据层并进行存储的步骤还包括:
通过全量拉链、增量拉链或增量流水的拉链方式将每个所述快照存储整合生成细节数据层并进行存储。
4.根据权利要求3所述的方法,所述通过全量拉链的拉链方式将每个所述快照存储整合生成细节数据层的步骤包括:
将所述预定周期内全量抽取的数据与历史数据作为主键索引;
将更新前的过期数据闭链处理存入所述pdata_status物理分区的expired分区中,并且将所述pend_date物理分区的值设为所述预定周期;其中,所述expired分区用于存储更新前的过期数据;
将更新后或者无更新的数据存入所述pdata_status物理分区的active 分区中,并且将所述pend_date物理分区的值设为最大;其中,active分区用于存储当前的有效数据;
将所述active分区写入bkt库,所述bkt库为备份数据库,用于存储每日全量有效数据,以及用于和第二天重新拉取的数据关联,还用于拉链表本身的回溯。
5.根据权利要求3所述的方法,所述通过增量拉链的拉链方式将每个所述快照存储整合生成细节数据层的步骤包括:
将所述预定周期内增量抽取的数据与历史数据作为全主键索引;
若所述主键在历史表和所述预定周期的快照表中均存在,则将所述历史表中的记录写入所述pdata_status物理分区的expired分区中,并且将所述pend_date物理分区的值设为所述预定周期;其中,所述expired分区用于存储更新前的过期数据;将未写入所述pdata_status物理分区的expired分区中的数据写入所述pdata_status物理分区的active分区中,并且将所述pend_date物理分区的值设为最大;其中,active分区用于存储当前的有效数据;将所述active分区写入bkt库,所述bkt库为备份数据库,用于存储每日全量有效数据,以及用于和第二天重新拉取的数据关联,还用于拉链表本身的回溯。
6.根据权利要求3所述的方法,所述通过增量流水的拉链方式将每个所述快照存储整合生成细节数据层的步骤包括:
将所述预定周期内增量抽取的数据保存为快照存储。
7.一种数据仓库的存储装置,包括:
用于将所述数据仓库中的操作性数据以预定周期为间隔保存为快照存储的装置;
用于将每个所述快照存储以拉链方式整合生成细节数据层并进行存储的装置;
所述用于将每个所述快照存储以拉链方式整合生成细节数据层并进行存储的装置包括:
用于将所述快照存储分别存储在用于区分闭链数据和有效数据的pdata_status物理分区以及用于文件裁剪的pend_date物理分区的装置。
8.根据权利要求7所述的装置,所述用于将所述数据仓库中的操作性数据以预定周期为间隔保存为快照存储的装置包括:
用于根据业务特点对于面向业务的操作性数据采取增量或全量的抽取方式的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611056644.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种名称匹配方法及装置
- 下一篇:一种大数据提取方法和系统