[发明专利]一种面向多负载的云数据库二级索引自动推荐方法和系统有效
| 申请号: | 202110579171.4 | 申请日: | 2021-05-26 |
| 公开(公告)号: | CN113360497B | 公开(公告)日: | 2022-04-05 |
| 发明(设计)人: | 李春花;周可;孙潇;方浩天;狄时禹;朱建平 | 申请(专利权)人: | 华中科技大学;腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/9535;G06K9/62;G06N3/04 |
| 代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 宋业斌 |
| 地址: | 430070 湖北省武汉*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 负载 数据库 二级 索引 自动 推荐 方法 系统 | ||
本发明公开了一种面向多负载的云数据库二级索引自动推荐方法,其包括:从数据库中的查询语句集合中随机选择多个查询语句组成查询语句样本集{q1,q2,...,qR},对样本集进行向量化处理,以得到查询语句向量组{x1,x2,...,xR},使用k‑means算法对向量组进行聚类分析,以得到k个2*N维向量作为k个查询模板、以及k个查询模板中每一个查询模板的权重,并用这k个查询模板表示整个查询语句集合的特征,将k个查询模板、以及每个查询模板的权重输入到预先训练好的多负载索引推荐模型中,以得到索引配置。本发明能够解决现有基于启发式的方法和机器学习的方法由于模型通用性差、只能为单一查询集合推荐索引配置,导致无法适用于云数据库业务场景的技术问题。
技术领域
本发明属于数据库技术领域,更具体地,涉及一种面向多负载的云数据库二级索引自动推荐方法和系统。
背景技术
近年来,随着互联网技术的发展,各个领域的数据量高速增长,互联网行业进入大数据时代,许多企业的数据存储和计算能力无法匹配数据的增长速度,其自身不再建立数据库,而是购买云服务提供商售卖的云数据库服务作为替代。云数据库的用户缺乏为云数据库添加合理索引配置的意识和知识,无法加速查询,提高数据库性能,导致了严重的索引缺失问题。因此,需要引入索引推荐方法来解决上述问题。
现有的索引推荐方法主要是基于启发式的方法和机器学习的方法,但是这些方案都存在一些不可忽略的缺陷:第一、模型通用性差,只能为单一查询集合推荐索引配置,因此无法适用于云数据库业务场景;第二、模型的训练耗时长,且需要与数据库交互,因此无法适用于云数据库业务场景。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种面向多负载的云数据库二级索引自动推荐方法,其目的在于,解决现有基于启发式的方法和机器学习的方法由于模型通用性差、只能为单一查询集合推荐索引配置,导致无法适用于云数据库业务场景的技术问题,以及由于模型的训练耗时长,且需要与数据库交互,导致无法适用于云数据库业务场景的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种面向多负载的云数据库二级索引自动推荐方法,包括以下步骤:
(1)从数据库中的查询语句集合中随机选择多个查询语句组成查询语句样本集{q1,q2,…,qR},对样本集进行向量化处理,以得到查询语句向量组{x1,x2,…,xR},其中qi表示第i个查询语句,i∈[1,R],R表示样本集中的查询语句总数,xi表示qi向量化后的结果。
(2)使用k-means算法对步骤(1)得到的向量组进行聚类分析,以得到k个2*N维向量作为k个查询模板、以及k个查询模板中每一个查询模板的权重,并用这k个查询模板表示整个查询语句集合的特征;
(3)将步骤(2)中得到的k个查询模板、以及每个查询模板的权重输入到预先训练好的多负载索引推荐模型中,以得到索引配置。
优选地,步骤(1)中向量化处理的过程,是针对每一个查询语句qi而言,使用该查询语句的选择度、以及该查询语句是否包含属性来对该查询语句qi进行向量化,qi向量化后的结果xi是一个2*N维的向量,且有:
xi=(ai,1,…,ai,N,ci,1,…,ci,N)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学;腾讯科技(深圳)有限公司,未经华中科技大学;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110579171.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种精密磨床
- 下一篇:集成电路及其形成方法





