[发明专利]一种问题的应答方法及装置有效
| 申请号: | 201710115633.0 | 申请日: | 2017-02-28 |
| 公开(公告)号: | CN108509463B | 公开(公告)日: | 2022-03-29 |
| 发明(设计)人: | 蒋欣;李航 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2458;G06K9/62 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 问题 应答 方法 装置 | ||
本发明实施例公开了一种问题的应答方法,包括:获取目标问题信息,根据目标问题信息确定候选问答对,计算候选问答对中的答案信息的置信度;其中,置信度用于指示候选问答对中的问题信息属于应答数据库或干扰数据库的概率,置信度与候选问答对中的问题信息属于应答数据库的概率正相关,判断置信度是否小于第一预设阈值,当置信度小于第一预设阈值时,则输出无法回答。这样,在根据匹配度从知识库中确定候选问答对后,再计算每个答案信息的置信度,置信度越高,则可以输出该答案信息,若置信度较低,则可以输出无法回答,以免误导用户,提高了应答的准确性。
技术领域
本发明涉及智能处理领域,尤其涉及一种问题的应答方法及装置。
背景技术
自动问答系统(或简称问答系统)是指对于用户用自然语言提出的问题,能够直接给出答案的系统。按照问题的范围,问答系统可以分为开放领域(open domain)和特定领域(close domain)。顾名思义,开放领域问答系统对于问题的范围不做限制,希望能回答所有世界知识的问题,例如百度知道、Yahoo Answers都是这样的系统。而特定领域系统则专注于回答特定领域的问题,如医疗行业、或者某个特定公司等,例如IBM Watson、StackOverflow都是这样的系统。问答系统实现方法,包括基于信息检索、基于结构化知识库、基于深度神经网络模型等等。无论那种方法,问答系统都是基于一个知识库构建的。知识库可以是各种形式的,如结构化的数据库、非结构化的文本语料库等。对于非结构化知识库,基于信息检索的问答系统是目前主流实现方式,常用的问答网站(如:百度知道、YahooAnswers、Quora、Stack Overflow),都是基于信息检索的问答系统。问答系统的评价指标主要为其回答问题的准确性,这也是目前大多数关于问答系统的研究和应用关注的重点。但在实际应用中,无论开放领域还是特定领域,任何一个问答系统的知识库都是有限的,所以问答系统能够回答的问题的范围也是一定是有限的。对于问答系统不能回答的问题,本文称之为未知问题(unknown question)。
现有技术中提供了一种基于信息检索的问答系统。该系统中应用于知识库为非结构化的文本语料库的情况。通常,在社区问答系统中,知识库是由很多“问题-答案”对组成,其中问题和答案均为自然语言。使用搜索引擎索引整个知识库,每个“问题-答案”对(简称“问答对”)作为一个“文档”索引。具体方式为:对于用户输入的问题,对其进行分析和处理后,作为查询词检索知识库,并得到候选文档(问答对)列表。基于候选问答对列表进行答案的选择或融合,形成最终答案,并返回给用户。
但是,在基于信息检索的问答系统中,当无法准确匹配到知识库中的问答对时,通常无法保证答案的准确性。例如,假设问答系统的知识库包含如下三个问题:1、问题:“2008年夏季奥运会的举办地是?”,答案:“北京”;2、问题:“哪个城市承办了2012年奥运?”,答案:“伦敦”;3、“2014年冬季奥运会在哪里举行?”,答案:“索契”。
当用户输入的问题为“2016年夏季奥运会的举办地在?”时,搜索引擎会检索该问题库,并计算用户问题与知识库中问题的匹配度,然后判断得到知识库中的第一个问题与用户问题的匹配度最高,从而给出相应的答案:“北京”。但这显然是错误的答案(正确答案为“里约”,不在知识库中)。基于该问答系统的知识库的情况,最合适的回答应该为“无法回答该问题”,即认为该用户问题为未知问题。这样做的原因在于,“无法回答”在这时是一个正确的信息反馈,优于将一个错误的答案返回给用户。
总之,基于信息检索的问答系统没有有效的识别未知问题的机制。原则上,它只能找到知识库中与用户问题相对最匹配的问题,并将相应的答案返回给用户。这时,对于超出问答系统知识库范围的问题,它往往会给用户错误的答案,从而对用户造成误导,甚至损失。
发明内容
本发明实施例提供了一种问题的应答方法,能够识别出用户所提出的问题是否为未知问题,提高应答的准确性。
本发明实施例第一方面提供一种问题的应答方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710115633.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种同步活动事务表的方法及装置
- 下一篇:一种数据处理方法和客户端设备





