[发明专利]从多个数据语料库中创建认知智能查询有效
申请号: | 201780087874.7 | 申请日: | 2017-12-12 |
公开(公告)号: | CN110383263B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | R·博达维卡;O·什穆里 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06N20/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅;姚杰 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 语料库 创建 认知 智能 查询 | ||
计算机实现的方法,认知智能系统和计算机程序产品适配包含多种数据类型的关系数据库。关系数据库中的非文本令牌被转换为文本形式。基于关系数据库中的令牌关系生成文本。从外部数据库检索用于文本的预训练的字向量集。对于关系数据库和外部数据库二者共用的令牌,初始化预训练的字向量集。预训练的向量集用于创建表示为结构查询语言(SQL)查询的认知智能查询。关系数据库的内容用于训练,同时初始化用于关系数据库和外部数据库共有的令牌的预训练字向量集。第一字向量集可以是不可变的或可变的,其中经由参数控制更新。
技术领域
本发明一般涉及搜索查询,并且更具体地涉及从多个数据语料库创建字向量以在数据库的搜索查询中使用。
背景技术
关系数据库中保持着大量潜在信息。例如,包含不同数据类型的数据库列(例如,数值、图像、日期等)以列间和列内关系的形式拥有重要的潜在信息。此外,关系数据模型忽略了许多列间或列内关系。此外,传统的结构化查询语言(SQL)查询缺乏底层关系的整体视图,因此无法提取和利用由数据库关系共同生成的语义关系。
发明内容
在各种实施例中,公开了一种认知智能系统、计算机程序产品和用于适配包含多种数据类型的关系数据库的计算机实现的方法。本发明的计算机实现的方法实施例包括:将关系数据库中的非文本令牌转换为文本形式,基于关系数据库中的令牌关系生成文本,基于文本检索预训练的字向量集,初始化用于关系数据库和外部数据库两者共用的令牌的预训练字向量集,以及使用预训练的向量集以创建表达为结构化查询语言(SQL)查询的认知智能查询。
附图说明
附图中,相同的附图标记在各个视图中指代相同或功能相似的元件,并且与下面的详细描述一起被并入并形成说明书的一部分,用于进一步说明各种实施例并解释根据本发明的各种原理和优点,其中:
图1是示出根据本发明的实施例的操作环境的一个示例的框图。
图2描绘了根据本发明的实施例的示例性过程;
图3描绘了根据本发明的实施例的图2的过程的示例状态。
图4描绘了根据本发明实施例的使用第一关系视图的示例客户分析查询。
图5描绘了根据本发明实施例的使用第二关系视图的另一示例客户分析查询。
图6描绘了根据本发明实施例的SQL认知智能(CI)查询示例;和
图7描绘了根据本发明的实施例的示例CI关系系统。
具体实施方式
本发明的一些实施例使用认知学习促进对关系数据库中的查询的响应。例如,一些计算机实现的方法实施例使得关系数据库能够使用标准SQL查询和一类新的基于SQL的查询来捕获和利用语义上下文相似性:认知智能(CI)查询。
作为概述,对于给定的关系数据库,例如包含关于特定公司的雇员的信息的数据库,典型的SQL查询仅在查询匹配时才返回结果。例如,如果查询想要雇员A的信息,例如工资,职位等,则只有在有雇员A时才返回答案。但是,根据本发明,使用CI查询,答案可能是通过检查数据库中嵌入的每个字的关系返回。对于传统的SQL用途,诸如名称、年龄、性别、标题等属性是独立的,查询不会利用此信息。
本发明的一些实施例使用字嵌入,其是来自自然语言处理(NLP)的无监督机器学习技术,以提取潜在信息。所公开的技术还可以适用于其他数据模型,例如多维在线分析处理(MOLAP)、JavaScript对象表示法(JSON)、可扩展标记语言(XML)、逗号分隔值(CSV)文件、电子表格等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780087874.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可游戏性服务应用编程接口
- 下一篇:检索系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置