[发明专利]数据库表的增量群集在审
| 申请号: | 201980046652.X | 申请日: | 2019-07-17 |
| 公开(公告)号: | CN112437916A | 公开(公告)日: | 2021-03-02 |
| 发明(设计)人: | 闫家奇;蒂埃里·克吕安斯;杰弗里·罗森;威廉·瓦丁顿;普拉桑纳·拉贾佩鲁马尔;阿布杜尔·穆尼尔 | 申请(专利权)人: | 斯诺弗雷克公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李琰;杨明钊 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据库 增量 群集 | ||
公开了一种数据库表的自动群集。一种用于数据库表的自动群集的方法,包括:接收已经对表执行了数据修改任务的指示;以及确定该表是否被充分群集。该方法包括:响应于确定表没有被充分群集,选择表的要被重新群集的一个或更多个微分区。该方法包括:将一个或更多个微分区中的每个微分区分配给执行节点以被重新群集。
相关申请的交叉引用
本申请要求在2018年7月17日提交的题为“SYSTEMS,METHODS,AND DEVICES FORAUTOMATIC CLUSTERING OF A DATABASE TABLE,设备”的美国临时专利申请序列号62/699,528的优先权,该申请以其整体通过引用并入本文,包括但不限于以下具体出现的那些部分,以下引用除外:如果上述申请的任何部分与本申请不一致,则该申请取代上述申请。
技术领域
本公开涉及数据库,并且更具体地涉及数据库的群集维护。
背景
数据库被广泛用于计算应用中的数据存储和访问。数据库存储的目标是以有组织的方式提供大量信息,以便可以对其进行访问、管理和更新。在数据库中,数据可以组织成行、列和表。不同的数据库存储系统可以用于存储不同类型的内容,诸如书目、全文、数字和/或图像内容。此外,在计算中,可以根据数据库的组织方法对不同的数据库系统进行分类。有许多不同类型的数据库,包括关系数据库、分布式数据库、云数据库、面向对象的数据库和其他数据库。
各种实体和公司都使用数据库来存储可能需要访问或分析的信息。在一个示例中,零售公司可以将所有销售交易的清单存储在数据库中。数据库可以包括关于交易何时发生、交易发生在哪里、交易的总成本、在交易中购买的所有物品的标识符和/或描述等信息。同一家零售公司还可能在同一数据库中存储员工信息,例如,该信息可能包括员工姓名、员工联系信息、员工工作历史记录、员工薪酬率等。根据该零售公司的需求,员工信息和交易信息可以存储在同一数据库的不同表中。当零售公司想要得知存储在数据库中的信息时,可能需要“查询”其数据库。该零售公司可能希望查找有关例如在特定商店工作的所有员工的姓名、在特定日期工作的所有员工、在特定时间范围内针对特定产品进行的所有交易等等的数据。
当零售公司要查询其数据库以从数据库中提取某些组织的信息时,将针对数据库数据执行查询语句。该查询根据一个或更多个查询谓词返回某些数据,这些谓词指示该查询应返回哪些信息。该查询从数据库中提取特定数据,并将该数据格式化为可读形式。可以用数据库理解的语言(诸如结构化查询语言(“SQL”))编写查询,以便数据库系统可以确定应定位哪些数据以及应如何返回数据。该查询可以请求存储在数据库内的任何相关信息。如果可以找到适当的数据来响应查询,则数据库有可能揭示复杂的趋势和活动。只能通过使用成功执行的查询来利用此功能。
然而,除上述示例外,零售公司可能具有存储大量信息的数据库表。对非常大的表执行查询可能具有挑战性,因为要扫描整个表需要大量的时间和计算资源。因此,可能希望在不扫描整个表的情况下执行查询。在一些实施方式中,可以通过仅扫描表的特定区段来执行查询,该特定区段包括用于响应查询的相关信息。如果表的特定区段井井有条,并且易于标识,则此实施方式最为有效。
鉴于前述内容,本文公开了用于自动数据库分区和群集的改善的系统、方法和设备。可以利用本公开的系统、方法和设备来提高数据库性能,尤其是提高数据库系统中的表扫描和查询执行性能。
附图简述
参考以下附图描述了本公开的非限制性和非穷举性的实施方式,其中,除非另外指明,否则贯穿各个视图,相似的附图标记指代相同或相似的部分。关于以下描述和附图,将更好地理解本公开的优点,其中:
图1A为根据本公开的实施例的经历排序和群集操作的数据库的示例表的框图;
图1B为根据本公开的实施例的经历增量群集操作的数据库的示例表的框图;
图2为根据本公开的实施例的分区选择算法的示例可视化;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯诺弗雷克公司,未经斯诺弗雷克公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980046652.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:控制方法、基金管理系统、程序及数据结构
- 下一篇:用于治疗胰腺癌的化合物





