[发明专利]修剪索引以增强数据库查询处理在审
| 申请号: | 202011561998.4 | 申请日: | 2020-12-25 |
| 公开(公告)号: | CN113051351A | 公开(公告)日: | 2021-06-29 |
| 发明(设计)人: | 蒂埃里·克吕安斯;本诺特·戴奇维勒;伊斯梅尔·欧基德;斯蒂芬·里克特 | 申请(专利权)人: | 斯诺弗雷克公司 |
| 主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/22;G06F16/2455;G06F16/27 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 俞立文;杨明钊 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 修剪 索引 增强 数据库 查询 处理 | ||
本申请公开了修剪索引以增强数据库查询处理。由基于网络的数据仓库访问被组织成微分区集合的源表。基于源表生成修剪索引。修剪索引包括过滤器集合,这些过滤器指示源表的每一列中不同值的位置。在基于网络的数据仓库接收针对源表的查询。使用修剪索引处理查询。查询的处理包括修剪源表的微分区集合以扫描匹配查询的数据,多个微分区的修剪包括使用修剪索引识别微分区子集以扫描匹配查询的数据。
技术领域
本公开的实施例总体上涉及数据库,并且更具体地,涉及生成并使用修剪索引(pruning index)来增强云数据仓库系统中的数据库查询处理。
背景
数据库广泛用于计算应用中的数据存储和访问。数据库存储的目标是以有组织的方式提供大量信息,以便可以访问、管理和更新。在数据库中,数据可以组织成行、列和表。各种实体和公司使用数据库来存储可能需要被访问或分析的信息。
云数据仓库(也称为“基于网络的数据仓库(network-based data warehouse)”或简称为“数据仓库”)是用于数据分析和报告的基于网络的系统,其包括来自一个或更多个不同源的集成数据的中央储存库。云数据仓库可以存储当前和历史数据,这些数据可用于根据存储在企业数据库中的数据为企业创建分析报告。为此,数据仓库通常提供商业智能工具、提取、变换数据并将数据加载到储存库中的工具、以及管理和检索元数据的工具。
当要从数据库中提取某些信息时,可以对数据库数据执行查询语句。云数据仓库系统处理该查询,并根据指示该查询应该返回什么信息的一个或更多个查询谓词(querypredicates)返回某些数据。数据仓库系统从数据库中提取具体的数据,并将这些数据格式化为可读的形式。但是,在非常大的表上执行查询可能很有挑战性,因为需要大量的时间和计算资源来扫描整个表以识别满足查询的数据。
附图简述
从下面给出的详细描述和本公开的各种实施例的附图中,将更全面地理解本公开。
图1示出根据本公开一些实施例的示例计算环境,其包括与云存储提供商系统通信的基于网络的数据仓库系统。
图2是示出根据本公开一些实施例的计算服务管理器的组件的框图。
图3是示出根据本公开一些实施例的执行平台的组件的框图。
图4是示出根据一些示例实施例的分块布隆过滤器(blocked bloom filter)的生成的概念图,该分块布隆过滤器可以形成由基于网络的数据仓库系统基于源表生成的修剪索引的一部分。
图5示出根据本公开一些实施例的示例修剪索引的一部分。
图6示出根据本公开一些实施例的修剪索引的单个布隆过滤器。
图7是示出根据一些实施例的关于修剪索引的创建的进一步细节的概念图。
图8是示出根据一些实施例的修剪索引的维护的概念图。
图9-13是示出根据本公开的一些实施例,基于网络的数据仓库系统在执行一种方法时的操作的流程图,该方法用于在处理数据库查询时生成和使用修剪索引。
图14示出根据本公开一些实施例的以计算机系统的形式机器的示意图表示,用于使机器执行本文所讨论方法中的任何一个或更多个的指令集合可以在该计算机系统内执行。
详细描述
现在将详细参考用于实现本发明主题的具体示例实施例。这些具体实施例的示例在附图中示出,并且具体细节在以下描述中阐述,以便提供对主题的透彻理解。应当理解,这些示例并不旨在将权利要求的范围限制于所示的实施例。相反,它们旨在覆盖可能包含在本公开范围内的替代、修改和等同物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯诺弗雷克公司,未经斯诺弗雷克公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011561998.4/2.html,转载请声明来源钻瓜专利网。





