[发明专利]一种数据库操作方法及装置在审
| 申请号: | 202110100847.7 | 申请日: | 2021-01-26 |
| 公开(公告)号: | CN112783921A | 公开(公告)日: | 2021-05-11 |
| 发明(设计)人: | 王阳;邱雪涛;王宇 | 申请(专利权)人: | 中国银联股份有限公司 |
| 主分类号: | G06F16/2452 | 分类号: | G06F16/2452;G06N20/00 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 宋正伟 |
| 地址: | 200135 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据库 操作方法 装置 | ||
1.一种数据库操作方法,其特征在于,包括:
获取目标自然语言文本;
将所述目标自然语言文本输入至基于自然语言向结构化查询语言转化NL2SQL的预测模型,获得所述目标自然语言文本的目标结构化查询语言SQL语句;
所述目标SQL语句的数据结构为预设数据结构;所述预设数据结构包括各部分;所述各部分与SQL语句的预设格式的各语句片段对应;
所述预测模型是基于目标数据集按照机器学习训练得到的;其中,所述目标数据集任一训练数据包括:自然语言文本以及所述自然语言文本对应的SQL语句,所述SQL语句的数据结构为所述预设数据结构;
通过执行所述目标SQL语句,操作目标数据库。
2.如权利要求1所述的方法,其特征在于,所述预测模型按照以下方式训练得到:
基于所述目标数据集中各训练数据的自然语言文本的第一类数据以及所述自然语言文本对应的SQL语句,对初始模型进行机器学习训练,得到中间模型;任一训练数据的第一类数据为所述训练数据中按照预设规则选择的数据;
基于所述各训练数据的自然语言文本的第二类数据以及所述自然语言文本对应的SQL语句,对所述中间模型进行机器学习训练,得到所述预测模型;所述第二类数据是所述训练数据中除所述第一类数据之外的数据。
3.如权利要求2所述的方法,其特征在于,所述各部分具体包括第一部分、第二部分、第三部分和第四部分;
其中,所述第一部分为待查询的各第一列名;所述第二部分为聚合函数;所述第三部分为各查询条件之间的关系运算符;所述第四部分为所述各查询条件;任一查询条件包括所限定的各第二列名、所述各第二列名的操作符及条件值;
所述第一类数据包括:所述第一部分、所述第二部分、所述第三部分和所述第四部分的所述各查询条件中所述各第二列名、所述各第二列名的操作符;所述第二类数据具体为所述第四部分中所述各第二列名的条件值。
4.如权利要求3所述的方法,其特征在于,所述基于所述目标数据集中各训练数据的自然语言文本的第一类数据以及所述自然语言文本对应的SQL语句,对初始模型进行机器学习训练,得到中间模型,包括:
针对任一轮机器学习训练,将所述目标数据集中任一训练数据的自然语言文本的第一类数据以及所述自然语言文本对应的SQL语句输入至所述初始模型,获得预测SQL语句中所述第一类数据的预测数据;
根据所述自然语言文本对应的SQL语句和所述第一类数据的预测数据,获得第一损失函数的函数值、第二损失函数的函数值和第三损失函数的函数值;
所述第一损失函数用于表征所述第一类数据的预测数据中对于所述第一部分以及所述第二部分的差异程度;所述第二损失函数用于表征所述第一类数据的预测数据中对于所述第三部分的差异程度;所述第三损失函数用于表征所述第一类数据的预测数据中对于所述第四部分的所述各查询条件中待操作的列名、操作符的差异程度;
若所述初始模型不满足第一预设收敛条件,则根据所述第一损失函数的函数值、所述第二损失函数的函数值和所述第三损失函数的函数值,调整所述初始模型的参数,并继续迭代训练所述初始模型;
若所述初始模型满足所述第一预设收敛条件,则将此时的所述初始模型作为所述中间模型。
5.如权利要求3所述的方法,其特征在于,所述基于所述各训练数据的自然语言文本的第二类数据以及所述自然语言文本对应的SQL语句,对所述中间模型进行机器学习训练,得到所述预测模型,包括:
针对任一轮机器学习训练,将所述目标数据集中任一训练数据的自然语言文本的第二类数据以及所述自然语言文本对应的SQL语句输入至所述中间模型,获得预测SQL语句中所述第二类数据的预测数据;
根据所述自然语言文本对应的SQL语句和所述第二类数据的预测数据,获得第四损失函数的函数值;
所述第四损失函数用于表征所述第二类数据的预测数据中对于所述第四部分的所述各查询条件中的条件值的差异程度;
若所述中间模型不满足第二预设收敛条件,则根据所述第四损失函数的函数值,调整所述中间模型的参数,并继续迭代训练所述中间模型;
若所述中间模型满足所述第二预设收敛条件,则将此时的所述中间模型作为所述预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110100847.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于冷水鱼与常温鱼的套式养殖方法
- 下一篇:一种落地式多头组合称重机





