[发明专利]一种基于多信息源的智能问答系统有效
申请号: | 202110025105.2 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112749265B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 张宇;尹治博;施琦;齐乐 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/295;G06N3/08;G06N3/04 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 张宏威 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息源 智能 问答 系统 | ||
本发明提出了一种基于多信息源的智能问答系统,所述系统具体包括基于知识库的问答模块KBQA、基于文档集的问答模块DBQA、基于常问问题集的问答模块QuesSimQA、第三方API模块和多元答案验证模块;对于用户的问题,所述KBQA模块、DBQA模块、QuesSimQA模块和第三方API模块分别给出一个答案,再通过多源答案验证模块对各个模块提供的答案进行验证打分排序,将得分最高的答案提交给用户;解决了知识库和常问问题集大小有限的问题,还解决了基于文档集的问答系统不易于支持复杂推理和网页文本质量较差的问题。
技术领域
本发明涉及信息获取领域,具体地,涉及一种基于多信息源的智能问答系统。
背景技术
问答系统作为一项提高互联网用户获取信息效率的技术,越来越受到学术界及工业界的关注。问答系统的应用场景非常广泛,例如在检索系统中,针对检索系统返回的Top-1结果进行优化,通过问答系统直接将页面中的答案返回给用户,无需用户再点击进入页面查找。另外,在聊天机器人中应用也较为广泛。在聊天机器人中主要用于解决协助商家解决用户提出的常见问题,节省了人工客服的开支,或是简单的和用户闲聊,为用户解答一些常识性问题。
目前,大多的问答系统,根据答案来源类型可分为基于知识库的问答系统、基于常问问题集的问答系统和基于文档库的问答系统。知识库是结构化的语义知识库,用于以符号形式描述物理世界中的概念及相互关系,其基本组成单位是三元组(SPO:Subject,Predicate,Object分别为主语,属性,宾语),三元组的基本形式包括实体1-关系-实体2和概念-属性-概念值,基于知识库的问答系统,如(毛麾.基于知识库的问答系统[J].现代计算机(专业版),2019(08):92-95.),对用户的问题进行语义理解和解析,进而利用知识库进行查询,推理得出答案,该类型的问答系统侧重精准的问题理解和答案查询,对于事实类型的问题而言,准确率较高,但通常给出较短的答案,不能很好的回答解释等类型的问题。常问问题集是包含许多问答对的集合,利用问答对的形式来组织知识,已是自然语言格式,质量较高,基于常问问题集的问答系统,如(高旭杨.基于语句相似度计算的FAQ问答系统设计[D].浙江大学,2018.),首先在问答对中查找与用户问题相似的候选问题集,接着利用相似度计算技术,在候选问题集中找到最相似的问句,将该问句的答案返回给用户,但是问答对数量有限,可能不包含用户的问题。文档集包括大量的文本和互联网网页,基于文档集的问答系统,如(邓志捷.基于阅读理解技术的问答系统设计与实现[D].北京邮电大学,2019.),根据用户的问题,在已有的文档库中搜索相关的文档,然后利用机器阅读理解技术从检索出的相关文档中抽取出答案返回给用户,但存在精度不高,网页内容质量较差等问题。
大多数的问答系统的答案来源单一,仅使用知识库或常问问题集或文档集作为答案来源。存在如下问题:
1.以知识库作为答案源的问答系统提供的答案往往较短,对于解释或原因等类型的问题,回答较差,并且结构化的知识库总是有限的。
2.以常问问题集作为答案源的问答系统中的问答对数量也有限,问答对可能不包含用户提问的相关问题,从而无法返回正确答案。
3.以文档集作为答案源的问答系统文利用文本寻找答案,存在着精度问题并且不容易支持复杂查询和推理。
发明内容
本发明为了解决上述问题,以多种信息源,即知识库、常问问题集、文档集以及第三方API作为答案来源,提出了一种基于多信息源的智能问答系统。
本发明是通过以下方案实现的:
一种基于多信息源的智能问答系统:所述系统具体包括基于知识库的问答模块KBQA、基于文档集的问答模块DBQA、基于常问问题集的问答模块QuesSimQA、第三方API模块和多元答案验证模块;对于用户的问题,所述KBQA模块、DBQA模块、QuesSimQA模块和第三方API模块分别给出一个答案,再通过多源答案验证模块对各个模块提供的答案进行验证打分排序,将得分最高的答案提交给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110025105.2/2.html,转载请声明来源钻瓜专利网。