[发明专利]一种信息处理方法及装置有效
申请号: | 201710109372.1 | 申请日: | 2017-02-27 |
公开(公告)号: | CN108509453B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 杨新颖;江国荣;李茂增 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06N20/00 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 | ||
本发明实施例提供一种信息处理方法及装置,涉及数据库技术领域。该方法应用于数据库管理系统中,所述数据库管理系统用于管理数据库,且包括内核,所述方法包括:所述内核获取目标信息;所述内核根据所述目标信息,确定所述目标信息的模型的创建信息;其中,所述目标信息的模型用于估算所述目标信息的执行代价,所述创建信息包括所述目标信息的模型的用途信息和训练算法信息;所述内核向外部训练器发送训练指令;其中,所述训练指令用于指示所述外部训练器根据所述目标信息和所述目标信息的模型的创建信息,对所述数据库中的数据进行机器学习训练,以得到所述目标信息的第一模型。
技术领域
本申请涉及数据库领域,尤其涉及一种信息处理方法及装置。
背景技术
在执行数据库查询时,当接收到来自客户端的查询语句,例如,SQL(structuredquery language,结构化查询语言)查询语句时,需要对该查询语句进行语法分析、预编译、优化等步骤,继而生成执行结构。优化器是数据库系统中影响SQL语句的执行效率最重要的组件,用于输出编译时数据库系统认为代价最小的执行计划,运行时执行器将按照生成的执行计划进行数据操作。
在优化器选择最优执行计划过程中,代价估算是一个很重要的环节。在代价估算过程中,需要先根据查询语句进行模型训练,得到查询语句的训练模型,再根据训练模型进行代价估算。目前,代价估算常用的模型训练方法为:根据待优化信息,例如查询语句,从数据库中进行数据采样,再根据得到的采样数据进行模型训练,即收集查询语句在采样数据中的统计信息,该统计信息可以为基于直方图、基于常见值或者基于常见值频率的统计信息。
由于上述统计信息只是根据数据库中采样得到的一少部分数据训练得到的信息,因此使用上述统计信息进行代价估算时,得到的代价参数的准确率是比较低的,根据该代价参数生成的代价最小的执行计划也会存在一定的冗余性,进而根据执行计划进行数据操作时,也会导致相应的SQL语句的执行效率较低。若按照上述模型训练的方法直接对数据库中所有的数据进行模型训练,又会因为数据库的容量较大,而耗费大量的时间,影响数据操作的进度。
发明内容
本发明实施例提供一种信息处理方法及装置,用于提高代价参数的准确率,同时尽可能减少对数据操作进度的影响。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种信息处理方法,应用于数据库管理系统中,数据库管理系统用于管理数据库,且包括内核,该方法包括:内核获取目标信息;其中,目标信息包括以下信息中的至少一项:目标查询语句、查询计划信息、所述数据库中数据的分布或变化信息、以及系统配置与环境信息;内核根据目标信息确定目标信息的模型的创建信息,目标信息的模型用于估算目标信息的代价参数,该创建信息包括目标信息的模型的模型用途信息和训练算法信息;内核向外部训练器发送训练指令,训练指令用于指示外部训练器根据目标信息和目标信息的模型的创建信息,通过机器学习训练数据库中数据,得到目标信息的第一模型。可选的,训练指令可以包括目标信息和/或目标信息的模型的创建信息。
上述技术方案中,数据库管理系统对数据库进行查询优化时,内核可以根据获取的目标信息,确定目标信息对应的模型的创建信息,之后向外部训练器发送训练指令,外部训练器通过机器学习进行模型训练,从而得到准确度较高的第一模型,从而根据第一模型进行代价估算时,可以提高代价参数的准确率,进而提高数据库的执行效率,同时又不影响数据操作的进度。
在第一方面的一种可能的实现方式中,若内核中设置有模型信息库,模型信息库用于存储通过机器学习训练得到的模型的模型信息,该方法还包括:内核根据第一模型,更新模型信息库。上述可能的技术方案中,通过内核中存储的模型信息库将内核与外部训练器关联起来,且在模型训练完成后,将第一模型的模型信息存储在模型信息库中,使得内核在进行查询优化时,可以直接根据模型信息库存储的模型信息进行优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710109372.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种匹配图挖掘方法及设备
- 下一篇:一种字符串的操作方法和相关装置