[发明专利]一种数据仓库的存储方法及装置有效
申请号: | 201611056644.8 | 申请日: | 2016-11-25 |
公开(公告)号: | CN108108374B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 李欢;崔宝宏 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/23;G06F16/28 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据仓库 存储 方法 装置 | ||
本发明提出了一种数据仓库的存储方法及装置,其中的方法包括:将所述数据仓库中的操作性数据以预定周期为间隔保存为快照存储;将每个所述快照存储以拉链方式整合生成细节数据层并进行存储。该方法通过将操作性数据保存为快照存储后,以针对性的拉链方式将快照存储整合为细节数据层并进行存储,从而能够既可以有效保存历史数据及快速响应查询请求,又能够极大的节省存储空间。
技术领域
本发明涉及计算机领域,尤其涉及一种数据仓库的存储方法及装置。
背景技术
随着在互联网中越来越多的采用大数据技术,业务数据成指数级增长,数据类型也呈现多样化,而数据仓库承载着记录业务历史数据、快速响应业务历史数据查询的重任。为了能够实现对在线数据进行备份与恢复,现有的数据仓库存储通常采用快照存储、覆盖存储或拉链等存储方式。
其中,快照存储是关于指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点的映像,该映像可以是其所表示的数据的一个副本,也可以是数据的一个复制品。
但是现有的快照存储需要占用大量的存储空间才能实现上述功能,并且现有覆盖存储存在复写方案无法记录历史数据以及现有的拉链方式也存在影响响应速度的问题。因此现有的存储策略已不能适应多样化的存储需求。
发明内容
本发明解决的技术问题之一是现有的数据仓库的存储方式存在的占用较大的存储空间、无法记录历史数据及影响响应速度。
根据本发明一方面的一个实施例,提供了一种数据仓库的存储方法,包括:
将所述数据仓库中的操作性数据以预定周期为间隔保存为快照存储;
将每个所述快照存储以拉链方式整合生成细节数据层并进行存储。
根据本发明另一方面的一个实施例,提供了一种数据仓库的存储装置,包括:
用于将所述数据仓库中的操作性数据以预定周期为间隔保存为快照存储的装置;
用于将每个所述快照存储以拉链方式整合生成细节数据层并进行存储的装置。
由于本实施例将操作性数据保存为快照存储后,以针对性的拉链方式将快照存储整合为细节数据层并进行存储,从而能够既可以有效保存历史数据及快速响应查询请求,又能够极大的节省存储空间。
本领域普通技术人员将了解,虽然下面的详细说明将参考图示实施例、附图进行,但本发明并不仅限于这些实施例。而是,本发明的范围是广泛的,且意在仅通过后附的权利要求限定本发明的范围。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出了根据本发明实施例一数据仓库的存储方法的流程图。
图2示出了本发明实施例的通过全量拉链的拉链方式将每个所述快照存储整合生成细节数据层的流程图。
图3示出了本发明实施例的通过增量拉链的拉链方式将每个所述快照存储整合生成细节数据层的流程图。
图4示出了本发明的实施例一提出的数据仓库的存储方法的流程图。
图5示出了本发明的实施例二提出的数据仓库的存储方法的流程图。
图6示出了本发明的实施例三提出的数据仓库的存储方法的流程图。
图7示出了根据本发明实施例一数据仓库的存储装置的框图。
图8示出了本发明的实施例四提出的数据仓库的存储装置的框图。
图9示出了本发明的实施例五提出的数据仓库的存储装置的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611056644.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种名称匹配方法及装置
- 下一篇:一种大数据提取方法和系统