[发明专利]用于处理输入问题以查询数据库的方法和系统有效
| 申请号: | 202010087651.4 | 申请日: | 2020-02-12 | 
| 公开(公告)号: | CN111563141B | 公开(公告)日: | 2023-05-26 | 
| 发明(设计)人: | V·舍伊宁;王治国;吴凌飞;许坤 | 申请(专利权)人: | 国际商业机器公司 | 
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/295 | 
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 程晨 | 
| 地址: | 美国*** | 国省代码: | 暂无信息 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 用于 处理 输入 问题 查询 数据库 方法 系统 | ||
1.一种用于处理输入问题以查询数据库的方法,该方法包括:
在计算机上的处理器中接收以自然语言呈现的输入问题;
使用所述处理器对所述输入问题进行预处理,以找出可能的结构化查询语言SQL查询的一个或多个条件值;
基于找出的所述一个或多个条件值枚举一个或多个可能的SQL查询;
使用复述模型对所枚举的SQL查询进行排名,所述复述模型被预训练以确定两个语句中的话语的序列的比较,第一语句包括所述输入问题,第二语句包括所枚举的SQL查询的SQL查询;
选择排名最高的SQL查询;以及
对数据库执行该排名最高的SQL查询,以在所述数据库中搜索对所述输入问题的响应。
2.如权利要求1所述的方法,还包括返回执行所述排名最高的SQL查询的一个或多个结果以回答所述输入问题。
3.如权利要求2所述的方法,其中自然语言引擎还被用于向用户提供对所述输入问题的所述回答。
4.如权利要求3所述的方法,其中还使用所述自然语言引擎向所述用户提供所述排名最高的SQL查询的解释,以解释被执行以查询所述数据库的所述排名最高的SQL查询。
5.如权利要求1所述的方法,其中所述复述模型包括基于预训练的长短期记忆LSTM的模型,该模型接收话语的序列的两个语句作为输入并确定所述两个语句的相似度。
6.如权利要求5所述的方法,其中所述预训练的复述模型包括长短期记忆递归神经网络LSTMRNN。
7.如权利要求5所述的方法,其中以监督方式和弱监督方式之一训练所述预训练的复述模型。
8.如权利要求5所述的方法,其中以监督方式训练所述预训练的复述模型,在该监督方式中手动收集用于训练的语句对。
9.如权利要求5所述的方法,其中以弱监督方式训练所述预训练的复述模型,在该弱监督方式中使用关于同一事件的大量新闻来收集用于训练的语句对。
10.如权利要求1所述的方法,该方法在云服务中实现。
11.如权利要求1所述的方法,该方法在能够访问所述数据库的服务器上实现。
12.一种响应输入问题以查询数据库的基于计算机的方法,该方法包括:
使用计算机上的处理器以自然语言接收输入问题;
根据所述输入问题生成话语的序列;
根据所述输入问题的词生成可能的结构化查询语言SQL查询的列表;
生成每个可能的SQL查询的话语的序列;
对于每个可能的SQL查询,执行复述模型,该复述模型测量为该SQL查询生成的话语的序列与根据所述输入问题生成的话语的序列之间的相似度;
确定哪个可能的SQL查询具有最高概率的相似含义;
使用确定为具有最高概率的相似含义的SQL查询对所述数据库执行查询;以及
通过报告被执行的SQL查询的结果来提供对所述输入问题的响应。
13.如权利要求12所述的基于计算机的方法,其中所述复述模型包括预训练的长短期记忆递归神经网络LSTMRNN,其接收两个语句作为输入并确定所述两个语句的相似度。
14.如权利要求12所述的基于计算机的方法,还包括提供对被执行的SQL查询的解释。
15.一种非暂态存储设备,其中存储有计算机可读指令集,以使计算机能够执行如权利要求1-14中任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010087651.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:固体燃料粉碎装置及方法、具备其的发电设备
- 下一篇:用于处理洗涤物的家用器具





