[发明专利]一种自然语言问答的方法无效

专利信息
申请号: 201210038756.6 申请日: 2012-02-17
公开(公告)号: CN102637192A 公开(公告)日: 2012-08-15
发明(设计)人: 郝宇;黄民烈;朱小燕 申请(专利权)人: 清华大学
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 北京中北知识产权代理有限公司 11253 代理人: 冯梦洪
地址: 100084*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自然语言 问答 方法
【说明书】:

技术领域

发明涉及人工智能的技术领域,具体地涉及一种自然语言问答的方法。 

背景技术

随着互联网信息爆炸式增长,用户有了更多获取信息的途径。但也对用户检索信息的能力提出了更多的挑战。关键词检索技术为众多搜索引擎所采用,并在许多领域都取得了不错的效果,在工业界获得了巨大的成功。然而,随着信息的增加,这种信息获取的方式逐渐无法满足用户的需求。这种基于关键词检索方式的信息获取方法主要有以下2个不足:(1)返回过多信息,用户需要进一步点击返回的链接才可以获得自己所需要的信息;(2)简单的若干个关键词有时无法明确地表达用户的需求,从而导致无法检索得到需要的结果。 

与之相反,问答方式允许用户以自然语言形式提问,并返回简洁明了的结果,这恰恰是用户所需要的。 

问答系统也是人工智能领域比较火热的研究课题之一。不过由于问答系统的复杂性,目前并没有太多相关的商用系统。IBM Watson(沃森)是比较出名的问答系统。不过该系统主要是处理事实类型的问题,并且只能回答答案是简单名词短语的问题。这类事实型问题虽然很重要,但用户有更多更复杂的问题希望能得到解决,例如寻找原因、寻找解决方案的问题。社区问答的出现就是希望依靠用户的力量帮助用户解决这些复杂问题,例如搜搜问问,百度知道等。但这类问答社区由于依赖其他用户作答,因此很难及时有效地回答用户的问题,尤其是与搜索引擎返回结果的速度相比就更难做到及时有效了。 

发明内容

为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种及时有效地回答用户问题的自然语言问答的方法。 

本发明的技术方案是:这种自然语言问答的方法,包括以下步骤: 

(1)对于用户输入的问题进行问题分析; 

(2)利用问题分析的结果以及社区问答的语料对问题作答; 

(3)利用问题分析的结果以及百科语料对问题作答; 

(4)对于从步骤(2)、(3)返回的答案,进行答案验证及选择,并最终返回最佳答案给用户。 

由于利用了社区问答以及百科数据回答用户自然语言问题,并进行答案验证及选择,所以能够及时有效地回答用户问题。 

附图说明

图1是根据本发明的自然语言问答的方法的流程图; 

图2是步骤(1)的流程图; 

图3是步骤(2)的流程图; 

图4是步骤(3)的流程图。 

具体实施方式

下面对本发明的技术方案做进一步的详细描述。 

如图1所示,这种自然语言问答的方法,包括以下步骤: 

(1)对于用户输入的问题进行问题分析; 

(2)利用问题分析的结果以及社区问答的语料对问题作答; 

(3)利用问题分析的结果以及百科语料对问题作答; 

(4)对于从步骤(2)、(3)返回的答案,进行答案验证及选择,并最终返回最佳答案给用户。 

由于利用了社区问答以及百科数据回答用户自然语言问题,并进行答案验证及选择,所以能够及时有效地回答用户问题。 

优选地,如图2所示,步骤(1)包括以下分步骤: 

(1.1)利用中文分词工具对于问题进行分词以及词性标注; 

(1.2)抽取问题中的核心概念,采用的方法是:利用词性标注结果,认为名词即重要概念;或者利用词性信息的同时还利用词频信息,计算每个词出现的文档集合的大小,滤去高于指定阈值的词; 

(1.3)进行问题分类,问题分类的标准是根据问题的需求进行:分为事实型问题,列表型问题,原因型问题,方法型问题,定义型问题以及导航型问题(如表1所示)。 

表1 

更进一步地,步骤(1.3)中采用根据马尔可夫逻辑网的方法进行分类: 

定义如下几种谓词: 

Type(q,t):如果问题q具有问题类型t则值为1,否则为0。 

MatchP(q,p):问题q可以匹配上strict pattern p的值为1,否则为0。 

MatchC(q,p):问题q匹配上soft pattern p的匹配度(0,1之间)。 

谓词之间的关系由如下两类formulas来约束。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210038756.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top