[发明专利]SQL语句生成方法、装置、服务器及计算机可读存储介质在审
| 申请号: | 202011642208.5 | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN112732741A | 公开(公告)日: | 2021-04-30 |
| 发明(设计)人: | 梁子敬;贺春艳;翁志 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2455;G06F40/284;G06F40/30;G06K9/62;G06N3/04 |
| 代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 张传义 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | sql 语句 生成 方法 装置 服务器 计算机 可读 存储 介质 | ||
1.一种SQL语句生成方法,其特征在于,应用于服务器,所述服务器存储有SQL语句生成模型,所述SQL语句生成模型包括预先训练好的Bert模型、预先训练好的LSTM模型或GRU模型、预先训练好的第一分类模型组和第二分类模型组,所述方法包括:
获取待回答的目标问题,并获取所述目标问题对应的数据报表;
根据所述目标问题和所述数据报表中的每个字段,生成N个目标语句片段,每个所述目标语句片段均包括所述目标问题、至少一个所述字段和至少一个字段标签序列;
将所述N个目标语句片段输入所述Bert模型,得到每个所述目标语句片段的语义向量和编码向量;
将每个所述目标语句片段的语义向量输入所述LSTM模型或GRU模型,得到目标语义向量;
根据每个所述目标语句片段的编码向量,生成所述字段标签序列中的每个字段标签对应的目标编码向量;
根据所述目标语义向量和所述第一分类模型组中的每个分类模型,确定每个预设SQL函数的字段个数和连接符的第一分类标签;
根据每个所述目标编码向量和所述第二分类模型组中的每个分类模型,确定所述数据报表中的各字段命中每个预设SQL函数的概率和聚合函数的第二分类标签;
根据所述各字段命中每个预设SQL函数的概率和每个预设SQL函数的字段个数,确定每个预设SQL函数的目标查询字段;
根据每个预设SQL函数的目标查询字段、所述连接符的第一分类标签和所述聚合函数的第二分类标签,生成可执行的SQL语句。
2.根据权利要求1所述的SQL语句生成方法,其特征在于,所述字段标签序列包括多个不同的字段标签,所述字段标签用于描述所述目标语句片段中的字段是否为预设SQL函数的目标查询字段。
3.根据权利要求1所述的SQL语句生成方法,其特征在于,所述目标语句片段的字符个数等于预设字符个数。
4.根据权利要求1所述的SQL语句生成方法,其特征在于,所述根据每个所述目标语句片段的编码向量,生成所述字段标签序列中的每个字段标签对应的目标编码向量,包括:
获取每个所述目标语句片段的编码向量中的各所述字段标签对应的编码子向量;
将相同所述字段标签对应的编码子向量进行拼接,得到每个所述字段标签对应的目标编码向量。
5.根据权利要求1-4中任一项所述的SQL语句生成方法,其特征在于,所述预设SQL函数包括select函数、where函数和Groupby函数,所述第一分类模型组包括第一分类模型、第二分类模型、第三分类模型和第四分类模型,所述根据所述目标语义向量和所述第一分类模型组中的每个分类模型,确定每个预设SQL函数的字段个数和连接符的第一分类标签,包括:
将所述目标语义向量输入所述第一分类模型,得到所述select函数的第一字段个数;
将所述目标语义向量输入所述第二分类模型,得到所述where函数的第二字段个数;
将所述目标语义向量输入所述第三分类模型,得到所述Groupby函数的第三字段个数;
将所述目标语义向量输入所述第四分类模型,得到所述连接符的第一分类标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011642208.5/1.html,转载请声明来源钻瓜专利网。





