[发明专利]多空间知识增强的知识图谱问答方法及系统在审

专利信息
申请号: 202111552990.6 申请日: 2021-12-17
公开(公告)号: CN114254093A 公开(公告)日: 2022-03-29
发明(设计)人: 李博涵;季烨;田佳颖;刘毅;吴佳骏;向宇轩;王高旭 申请(专利权)人: 南京航空航天大学
主分类号: G06F16/332 分类号: G06F16/332;G06F16/36;G06N3/04;G06N3/08
代理公司: 北京高沃律师事务所 11569 代理人: 赵兴华
地址: 210016 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 空间 知识 增强 图谱 问答 方法 系统
【说明书】:

发明涉及一种多空间知识增强的知识图谱问答方法及系统,属于知识图谱表示学习和问答系统领域,首先通过基于自注意力机制的神经网络对输入问句进行特征提取,根据问句中词级之间的关联性以及词序信息,对问句进行向量表示,更大程度的保留问句中信息;其次将知识图谱分别嵌入欧几里德空间、复向量空间和双曲空间,候选答案实体从多个维度进行表示,利用不同嵌入空间的信息保留差异性,将候选答案实体表示到多个向量空间之中,扩充其向量表示的数量,对候选答案全面合理表示;最后通过双重的注意力网络,动态的聚合知识图谱中的信息并动态的计算候选答案的得分,强化了知识图谱问答模型在答案侧的知识表示能力,提高了知识图谱问答模型的准确率。

技术领域

本发明涉及知识图谱表示学习和问答系统领域,特别是涉及一种多空间知识增强的知识图谱问答方法及系统。

背景技术

知识图谱的快速发展使得如何利用好知识图谱变得越来越重要,知识图谱问答作为下游任务中的一个重要研究方向,在近年来也受到了广泛的关注。知识图谱问答的目标是对输入的自然语言问题,系统可以自动地从知识图谱中找到答案。知识图谱问答与对话系统和机器人的交互式对话不同,知识图谱问答回答的答案是知识图谱中的实体或实体关系,而后者的答案可能是通过模型生成得来。

知识图谱问答的方法从大体上可以分为两类:基于语义解析的方法和基于信息抽取的方法。基于语义解析的方法的目标是构建一个可以将自然语言转换成中间逻辑形式的语义解析器,这些中间逻辑形式可以让问答系统从知识图谱中检索出答案。传统的受监督的语义解析器在词法提取和模型训练方面严重依赖被注释过的逻辑形式。由于注释数据的局限性,这些方法很难扩展到大范围的领域,并且由于语义解析器的局限性很难有很好的覆盖性。近些年来,有很多工作尝试去解决这些问题,具有代表性的研究工作有加入人为构建的规则和特征以及采用弱监督和远程监督的训练策略。

与基于语义解析的方法不同,基于信息抽取的方法是从知识图谱中先筛选出一个候选答案集,然后将问题和候选答案映射到向量空间中并计算它们之间的得分,最后按照得分的高低寻找出最终答案。由于基于信息抽取的方法不需要人为的规则,这类方法更容易扩展到更大规模或者更复杂的知识图谱中,因而在最近几年也更受到研究者们的关注。基于信息抽取的方法的第一步是构建候选答案集,对于一个输入的问句,可以通过开放接口找到它的主题实体,然后将主题实体通过实体链接到知识图谱中。一般来说,研究者们会选择主题实体的一跳或者二跳节点构成候选答案集。当构建好候选答案集之后,基于信息抽取的方法可以从大体上分为三个部分:问句的向量表示、候选答案的向量表示以及问句和候选答案之间的得分计算。在问句的向量表示方面,最早的方法使用简单的词袋模型进行问句表示。之后为了利用好问句中词汇的词序信息,研究者开始尝试使用更复杂的深度神经网络,具有代表性的工作包括使用多维卷积神经网络以及双向的循环神经网络。除此以外,一些研究者尝试使用问句之外的外部信息来增加问句的信息。问句的向量表示模型和自然语言处理领域的发展是息息相关的,近年来,基于自注意力机制的深度神经网络在自然语言处理领域大放异彩,在许多下游任务中都取得了非常优秀的成绩。因而在问句的表示学习上,需要跟进自然语言处理领域的先进成果,设计更为优秀的特征提取模块。在候选答案表示上,研究者们聚焦在如何更好地在知识图谱中表示好候选答案。研究者们最初使用包含候选答案的子图来进行表示,之后的工作认为子图的表示方式不够准确,又提出了使用答案实体、答案类型、答案上下文等来表示的方式。最近的工作尝试将问句向量与知识图谱中的实体向量关联起来,从而使知识图谱中的每个类型的表示可以按照不同权重为候选答案提供信息。

知识图谱问答对知识图谱中信息的利用是基于知识图谱表示学习模型的,在知识图谱表示学习模型的使用上,这些问答方法都使用了传统的欧几里得空间下基于语义平移理论的模型。但是知识图谱表示模型在近些年也取得了飞速的发展,特别是许多知识图谱表示学习模型已经不局限于欧几里德空间,将语义平移理论拓展到了复向量空间等空间。相关的研究工作也证明了不同的嵌入空间对知识图谱中信息的保留是存在差异的,比如嵌入到复向量空间更有利于逻辑推理而嵌入到双曲空间则能更好地保留知识图谱的结构信息。因此,仅使用一种知识图谱嵌入空间并不能准确描述知识图谱问答模型,影响问答的准确度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111552990.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top