[发明专利]基于相关性判断的SQL解析方法、装置和计算机设备有效

申请号：	202110363570.7	申请日：	2021-04-02
公开（公告）号：	CN113011136B	公开（公告）日：	2022-09-16
发明（设计）人：	谭真;张啸宇;赵翔;王俞涵;黄旭倩;廖劲智;肖卫东;唐九阳	申请（专利权）人：	中国人民解放军国防科技大学
主分类号：	G06F40/126	分类号：	G06F40/126;G06F40/205;G06F40/30;G06F16/33;G06F16/28
代理公司：	长沙国科天河知识产权代理有限公司 43225	代理人：	徐志宏
地址：	410073 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于相关性判断 sql 解析方法装置计算机设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种基于相关性判断的SQL解析方法、装置和计算机设备。通过对自然语言进行编码，得到自然语言问题序列编码和字段序列编码，然后通过注意力机制，得到自然语言问题与字段序列的交互信息，从而通过交互信息，可以预测自然语言文本的自然语言问题，从而可以判断是否是数据库相关的问题，以上，就构建了字段序列与数据库的关联，在判断自然语言问题之后，可以采用模板匹配的方式，解析SQL语句，从而实现SQL解析，上述方法中，无需对样本进行标注，减少标注成本，另外，通过建立数据库与语义的关联，可以提高SQL解析的效率。

技术领域

本申请涉及自然语言处理技术领域，特别是涉及一种基于相关性判断的 SQL解析方法、装置和计算机设备。

背景技术

在SQL解析的实际应用场景中，用户的行为不可控，其所输入的自然语言问题不一定与目标数据库相关，导致该自然语言问题无法在目标数据库上进行解析。受限于主流SQL解析数据集构建情况，很少有研究人员在SQL解析任务中考虑自然语言问题与数据库的相关性。

目前，目前，基于相关性判断的SQL解析任务缺少公开数据集，现有SQL 解析数据集均未包含自然语言问题的相关性判断。由于人工标注数据成本较高，采用全面匹配方法进行SQL解析的成本高、效率低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够解决SQL解析成本和效率兼顾的基于相关性判断的SQL解析方法、装置、计算机设备和存储介质。

一种基于相关性判断的SQL解析方法，所述方法包括：

将自然文本样本输入SQL解析模型；所述SQL解析模型包括：编码模块、相关性判断模块和SQL解析模块；

根据预训练的所述编码模块对所述自然文本样本进行解析，得到字段序列和自然语言问题序列；其中，所述字段序列编码和所述自然语言问题序列编码串联构成整体编码信息；所述自然语言问题序列编码中的一个自然语言问题编码对应一个字段序列编码的字段编码；所述字段编码对应一个输入序列编码；

将所述整体编码信息输入所述相关性判断模块，根据所述整体编码信息和所述输入序列编码，确定所述整体编码信息中各个输入序列编码的注意力权重，根据所述注意力权重和所述输入序列编码，得到所述整体编码信息对应的注意力加权向量；

将所述注意力加权向量和所述整体编码信息进行拼接，得到所述字段序列编码和所述自然语言问题序列编码的交互信息；

将所述交互信息输入相关性判断模块的全连接层，得到所述自然文本样本对应的预测自然语言问题；

将所述预测自然语言问题和所述整体编码信息输入所述SQL解析模块，解析得到预测SQL语句；

根据预先构建的损失函数对所述SQL解析模型进行训练，得到训练好的 SQL解析模型；

将待解析自然文本输入训练好的SQL解析模型，得到对应的SQL语句。

在其中一个实施例中，还包括：获取自然文本样本的初始序列为：

[CLS],q₁,q₂,...,q_L,[SEP],c₁₁,c₁₂,...,[SEP],c₂₁,c₂₂,...,[SEP],...,[SEP]

其中，[CLS]表示初始标记，[SEP]表示间隔符，q₁,q₂,...,q_L是自然语言问题序列，c_t1,c_t2,...是第t个字段的输入序列，L表示自然语言问题的长度；q_t表示自然语言问题序列中的第t个token；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学，未经中国人民解放军国防科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110363570.7/2.html，转载请声明来源钻瓜专利网。

上一篇：DMP纳米粒在mRNA递送中的用途
下一篇：适于水利工程行业的通用BIM展示平台构建方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于相关性判断的SQL解析方法、装置和计算机设备有效

专利文献下载