[发明专利]基数估计方法及装置在审
申请号: | 202310343475.X | 申请日: | 2023-03-31 |
公开(公告)号: | CN116662378A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 李俊虎;徐泉清;聂铁铮;杨传辉;申德荣;寇月 | 申请(专利权)人: | 东北大学;北京奥星贝斯科技有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 李威 |
地址: | 110167 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基数 估计 方法 装置 | ||
本说明书一个或多个实施例提供一种基数估计方法及装置,涉及计算机技术领域。该方法包括获取数据查询请求,数据查询请求用于在数据库中查询多个第一指定列中的数据;根据多个第一指定列之间的关联关系,计算多个第一指定列共同的联合概率;根据联合概率,估计数据查询请求对应的基数。本说明书提供的方法不仅能够在多列查询的场景下提供准确的基数估计结果,并且在高负载情况下仍能保持优异的性能表现,进而提高了数据库的查询效率。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种基数估计方法及装置。
背景技术
基数估计是数据库优化器中非常重要的一个模块,该模块会向优化器提供查询可能返回的行数,从而引导查询计划的选择,并直接影响甚至决定查询的速度。
相关技术中的基数估计方法往往依赖于独立性假设和均匀分布假设,在这两种假设下,基数估计被建模为简单的统计问题。然而,现实业务中的数据往往是存在关联,并且是倾斜分布的,这使得相关技术中的基数估计方法无法得到准确的估计结果,从而严重影响数据库查询性能。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种基数估计方法及装置。
为实现上述目的,本说明书一个或多个实施例提供技术方案如下:
根据本说明书一个或多个实施例的第一方面,提出了一种基数估计方法,包括:
获取数据查询请求,数据查询请求用于在数据库中查询多个第一指定列中的数据;
根据多个第一指定列之间的关联关系,计算多个第一指定列共同的联合概率;
根据联合概率,估计数据查询请求对应的基数。
根据本说明书一个或多个实施例的第二方面,提出了一种基数估计装置,包括:
获取模块,用于获取数据查询请求,数据查询请求用于在数据库中查询多个第一指定列中的数据;
计算模块,用于根据多个第一指定列之间的关联关系,计算多个第一指定列共同的联合概率;
估计模块,用于根据联合概率,估计数据查询请求对应的基数。
根据本说明书一个或多个实施例的第三方面,提出了一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器通过运行可执行指令以实现如第一方面的方法。
根据本说明书一个或多个实施例的第四方面,提出了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面方法的步骤。
本说明书提供的基数估计方法,通过确定多个第一指定列之间的关系,进而计算其联合概率,摆脱了对独立性假设和均匀分布假设的依赖。本说明书提供的方法不仅能够在多列查询的场景下提供准确的基数估计结果,并且在高负载情况下仍能保持优异的性能表现,进而提高了数据库的查询效率。
附图说明
图1是一示例性实施例提供的一种系统架构示意图。
图2是一示例性实施例提供的一种基数估计方法的流程示意图。
图3是一示例性实施例提供的一种联合概率计算方法示意图。
图4是一示例性实施例提供的一种概率图模型示意图。
图5是一示例性实施例提供的一种基数估计方法的具体应用示意图。
图6是一示例性实施例提供的一种概率图模型构建方法的流程示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学;北京奥星贝斯科技有限公司,未经东北大学;北京奥星贝斯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310343475.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便携式组件清洗工具
- 下一篇:一种抑制碳化钨颗粒沉降的方法及耐磨复合涂层