[发明专利]基于问句和知识图结构分析的自然语言问答方法及系统有效
申请号: | 201711204633.4 | 申请日: | 2017-11-27 |
公开(公告)号: | CN108052547B | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 袁平鹏;金海;李高峰 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F17/27 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 廖盈春;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 问句 知识 结构 分析 自然语言 问答 方法 系统 | ||
本发明公开了一种基于问句和知识图结构分析的自然语言问答方法及系统,属于图计算和自然语言问答领域。本发明方法针对现有的各种问答系统所存在的问题,提出了基于问句和知识图的结构构建、分析及匹配的自然语言问答方法,从而拓展可回答自然语言问题的种类,同时提升答案的准确率。本发明方法通过以实体节点为中心的遍历,以及设计抽取规则来采用图的结构来表示查询问句;基于查询图在知识图中映射查找覆盖所有答案的子图。通过构建路径和短语的语义向量,在实现对答案子图过滤筛选的同时,计算匹配的相似度,从而得出候选答案。本发明方法方案简洁,效果明显。
技术领域
本发明属于图计算和自然语言问答领域,更具体地,涉及一种基于问句和知识图结构分析的自然语言问答方法及系统。
背景技术
随着互联网的飞速发展,越来越多的大规模结构化的知识图被构建。知识图在整合信息,加强智能搜索方面发挥着越来越重要的作用。但是这种知识图中存储的都是结构化的信息,这使得它很难被一般用户所直接使用。
基于查询语言和数据获取协议(SPARQL Protocol and RDF Query Language,SPARQL)的查询,是一种针对资源描述框架(Resource Description Framework,RDF)数据的结构化的查询,虽然可以直接检索知识图,但是它需要用户自己根据需求来编写相应的查询语句,这就要求用户有一定的计算机基础,同时对知识图中信息的存储方式有一定的了解。基于关键字的查询,可以方便用户使用,但是由于查询信息的不完整使得答案的正确率太低。
自然语言是一种非结构化的语句,而知识图中存储的是结构化的信息,所以现有的方法中首先考虑将自然语言查询转换成SPARQL结构化查询,但是需要首先构建结构化的查询模式,然后将自然语言的问句转换为特定的模式;由于存在歧义,近似匹配等问题,导致转换效果并不理想;另外,SPARQL查询只能处理边属性严格匹配的查询,所以就可能造成部分查询结果的缺失。
知识图是基于图结构来构建的,所以可以采用图匹配的方式来实现问答,这就需要将自然语言问句转换成查询图,然后实现查询图的模式匹配。但是在构建查询图中会存在信息抽取不准确等问题;另外,在实现查询图的模式匹配中,特别是边的语义模式匹配中,存在匹配不准确的问题;针对这些问题现有的方法都不能很好的解决。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于问句和知识图结构分析的自然语言问答方法及系统,由此解决现有知识图查询方法存在的查询准确率较低的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于问句和知识图结构分析的自然语言问答方法,包括:
(1)识别自然语言问句中的命名实体,并对所述自然语言问句进行解析以构建解析树;
(2)在所述解析树中采用以所述命名实体中的元素为中心的方式进行遍历,在遍历过程中依据预设关系抽取规则从所述解析树中抽取目标信息,构建所述自然语言问句的查询图;
(3)对于所述查询图中的每个节点,构建在预设知识图中与所述查询图中各节点相匹配的节点候选集;
(4)在所述预设知识图中以所述节点候选集中的每一个节点为中心进行遍历,得到以所述节点候选集中的每一个节点为中心的覆盖所有答案的子图;
(5)针对所述预设知识图中的路径构建路径语义向量,针对所述查询图中的边属性构建边属性语义向量;
(6)根据所述边属性语义向量与所述路径语义向量来计算所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度,过滤掉不满足预设相似度要求的子图得到候选答案子图;
(7)根据所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度得到各候选答案子图的整体相似度,确定出整体相似度较高的前k个答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711204633.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种定制客户端用户界面的方法及装置
- 下一篇:碳氢化合物的卤化