[发明专利]一种基于知识图谱的数据库搜索方法有效
| 申请号: | 201510289249.3 | 申请日: | 2015-05-29 |
| 公开(公告)号: | CN104866593B | 公开(公告)日: | 2018-05-22 |
| 发明(设计)人: | 蒋锴;任志宏;傅军;杨怡;王辉;何加浪 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 孟红梅 |
| 地址: | 210007 江苏省南京*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 知识 图谱 数据库 搜索 方法 | ||
本发明涉及一种基于知识图谱的数据库搜索方法,属于结构化数据挖掘和搜索领域。本发明提出的方法首先对数据库表类型和表间约束等要素进行分析,然后利用表和表间约束生成相应的概念、实体和实体间关系,并据此建立知识图谱服务。在获取用户输入的自然语言查询后,对用户查询的各要素进行检测得到查询的要素模式和要素值,接着将要素模式在模板库中进行匹配得到对应的查询模式,然后将查询的要素值填充到查询模式中从而得到知识图谱查询语句,最后在知识图谱服务中执行该查询语句,得到用户查询相应的知识返回给用户。本发明提出的方法能有效地组织和展现数据库中的数据及内在关系,并支持用户的自然语言查询,从而提高了数据库搜索的用户体验。
技术领域
本发明涉及结构化数据挖掘和搜索方法,特别涉及一种基于知识图谱的支持用户自然语言查询的数据库搜索方法。
背景技术
知识图谱技术(Knowledge Graph)是目前在知识工程领域发展最引人注目的技术。简单来说知识图谱就是用图(Graph)模型来对知识和知识间的关系进行表示,图的节点代表知识所涉及的概念或实体,图的边代表概念或实体间的关系,众多的节点和边构成的图就可以对知识进行完整而清晰地描述。大量知识图谱被整合并按照知识体系分类组织,就形成了知识库(Knowledge Base)。近年来,通过互联网众包方式构建或者算法自动抽取,形成了一些包含海量实体的知识库,比较知名的知识库有YAGO,DBpedia,Freebase等。目前知识图谱技术支撑了许多革命性的服务和应用。例如Google、必应、百度等主流搜索引擎在搜索结果页面增加了与查询词相关的实体等知识;苹果的Siri、微软的Cortana等智能手机助手能回答用户的提问;知识搜索引擎Walfram Alpha能根据用户输入的问题直接给出答案,而不是像传统的搜索引擎那样给出相关文档。
尽管知识图谱技术在互联网领域等开放数据上得到了广泛应用,但是在关系数据库等传统领域却鲜有应用。关系数据库以结构化方式对数据进行存储,支持SQL等查询语句对数据进行查询,是一种可靠和高效的存储方式。但是关系数据库对数据的语义和内在关系的组织和表现存在不足,而且关系数据库所提供的SQL查询方式要求用户具有专业知识而且体验不佳。
发明内容
发明目的:本发明针对目前数据库搜索存在的不足,提出一种基于知识图谱的支持用户自然语言查询的数据库搜索方法,以降低数据库搜索使用难度,提高用户体验。
技术方案:为了解决上述技术问题,本发明公开了一种基于知识图谱的数据库搜索方法,包括知识图谱构建和自然语言查询处理两大步骤;
所述知识图谱构建,包括:
a.对数据库进行要素分析,并将表分为存储具体对象的数据表和存储对象间关系的关系表,所述要素包括表名、列名和表间的约束关系;
b.根据数据表和数据表中的记录建立概念节点和实体节点;
c.根据数据表间外键约束关系和存储对象间关系的关系表建立实体节点之间的关系;
d.利用知识图谱工具对步骤b中生成的节点和步骤c中生成的节点间的关系进行存储,建立知识图谱服务;
所述自然语言查询处理,包括:
e.对用户输入的查询语句进行分词,并将分词后的词汇进行查询要素映射,得到查询的要素模式和要素值,所述查询要素包括变量、关系、实体和概念;
f.将要素模式在模板库中进行匹配得到对应的查询模式;
g.将要素值填充到查询模式中得到知识图谱查询语句;
h.在知识图谱服务中执行知识图谱查询语句得到用户查询所对应的知识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510289249.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据库访问请求的分析方法和装置
- 下一篇:数据报表的生成方法和装置





