[发明专利]自然语言问答方法及装置有效

专利信息
申请号: 201410085902.X 申请日: 2014-03-10
公开(公告)号: CN104915340B 公开(公告)日: 2019-09-10
发明(设计)人: 邹磊;刘婷婷;路彦雄;刘怀军;黄睿哲 申请(专利权)人: 北京大学;腾讯科技(深圳)有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F17/27
代理公司: 北京三高永信知识产权代理有限责任公司 11138 代理人: 滕一斌
地址: 100871*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 自然语言 问答 方法 装置
【说明书】:

技术领域

发明实施例涉及信息检索和处理领域,特别涉及一种自然语言问答方法及装置。

背景技术

问答系统是信息检索系统的一种高级形式。它能用准确、简洁的自然语言回答用户用自然语言提出的问题。

RDF(Resource Description Framework,资源描述框架)资源库是实现问答系统的一个基础。RDF资源库,也称知识库,通常包括大量的便于计算机识别和理解的三元组。每个三元组表示为主体、谓词和客体,比如主体“《演员的自我修养》”、谓词“类别”和客体“书籍”。目前的问答系统主要包括两个阶段:问题理解阶段和查询执行阶段。在问题理解阶段,问答系统首先将自然语言问句N翻译为SPARQLs查询语句,SPARQLs是一种用于在RDF资源库中执行查询的语言;然后在查询执行阶段,问答系统将SPARQLs查询语句输入SPARQLs搜索引擎在RDF资源库中搜索出自然语言问句N的答案。

如图1所示,当一个自然语言问句“谁嫁给了那个在费城中出演的演员?”输入到问答系统后,问答系统首先将该自然语言问句翻译成SPARQLs查询语句12:

“?x主演费城_(电影);

?x类型演员;

?x配偶?y”,

然后,SPARQLs搜索引擎14输出查询结果16:“?y=梅拉妮·格里菲斯”。

在实现本发明实施例的过程中,发明人发现背景技术至少存在以下问题:由于自然语言具有歧义性,比如短语“费城”可能是指费城(城市)、费城(电影)和费城_76人队,上述技术在将自然语言问句N翻译到SPARQLs查询语句12的过程中,需要根据自然语言问句N的语义来消除歧义。而消歧并不是一项简单的任务,不仅需要耗费很大的计算量,而且如果消歧失败的话,还会干扰结果的正确性。

发明内容

为了解决在问题理解阶段需要耗费很大的计算量来消歧的问题,本发明实施例提供了一种自然语言问答方法及装置。所述技术方案如下:

第一方面,提供了一种自然语言问答方法,所述方法包括:

获取自然语言问句N;

将所述自然语言问句N转换为查询语义图Qs,所述查询语义图Qs中的每条边代表所述自然语言问句N中的一个语义关系;

在资源描述框架RDF图G中查找与所述查询语义图Qs匹配的子图;

根据所述子图得到所述自然语言问句N的答案。

可选地,所述将所述自然语言问句N转换为查询语义图Qs,包括:

发现所述自然语言问句N中的关系短语;

发现每个所述关系短语的伴随参数;

构建查询语义图Qs,所述查询语义图Qs中的每条边对应一个所述关系短语,所述查询语义图Qs中的每个顶点对应一个所述伴随参数。

可选地,所述发现所述自然语言问句N中的关系短语,包括:

从所述自然语言问句中分析出句法依赖树Y;

根据预设的关系短语字典,查询所述关系短语字典中存在于所述句法依赖树Y的关系短语;其中,所述关系短语字典中的关系短语存在于所述句法依赖树Y,当且仅当所述句法依赖树Y中存在一个相连子树y满足如下两个条件:

条件1:在所述相连子树y中的每个节点包括所述关系短语的一个词,且所述相连子树y包括所述关系短语的所有词;

条件2:无法在所述句法依赖树Y中找到一个子树y`,所述子树y`也满足所述条件1且所述相连子树y是所述子树y`的子树。

可选地,所述发现每个所述关系短语的伴随参数,包括:

对于每个所述关系短语在所述句法依赖树Y中所对应的所述相连子树y,通过主体类语义关系和客体类语义关系在所述相连子树y中发现所述关系短语的伴随参数;

所述主体类语义关系包括:主语,名词性主语,被动式名词性主语,从句型主语,被动式从句主语,控制性主语,所有格修饰符;

所述客体类语义关系包括:宾语,介词性宾语,直接宾语,间接宾语。

可选地,所述在RDF图G中查找与所述查询语义图Qs匹配的子图,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;腾讯科技(深圳)有限公司,未经北京大学;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410085902.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top