[发明专利]面向多源异构数据源的智能问答方法及装置有效
| 申请号: | 202110059191.9 | 申请日: | 2021-01-15 |
| 公开(公告)号: | CN112948546B | 公开(公告)日: | 2021-11-23 |
| 发明(设计)人: | 孙显;刘庆;李树超;张泽群;刘康;李晓宇;李欣隆;吕博 | 申请(专利权)人: | 中国科学院空天信息创新研究院 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30;G06K9/62;G06N3/04;G06N3/08;G06N5/04 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王文思 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 面向 多源异构 数据源 智能 问答 方法 装置 | ||
本发明提供一种面向多源异构数据源的智能问答方法及装置,方法包括:计算输入问题与候选关系的第一相似度;根据第一相似度,从知识库中获取第一答案;根据输入问题检索多跳文本;计算多跳文本中的句子与输入问题之间的第二相似度以及多跳文本中的实体与输入问题之间的第三相似度;根据第二相似度及第三相似度,从多跳文本中获取第二答案;判定第一答案和第二答案的关系,输出输入问题的答案文本。通过本发明的面向多源异构数据源的智能问答方法及装置,提升了输出答案的准确度以及丰富性,能够返回一个更易于用户理解、简洁完整的答案。
技术领域
本发明涉及深度学习和智能问答技术领域,尤其涉及一种面向多源异构数据源的智能问答方法及装置。
背景技术
智能问答的实现涉及到知识库问答、信息检索、知识表示等多个技术,已逐步应用于知识获取、聊天机器人等场景中。根据问题答案的来源,可将问答技术分为两个方向,一个是答案来源于结构化信息的知识库问答技术;另一个是答案来源于非结构化信息的文本问答技术。
一方面,随着深度学习技术的快速发展,越来越多的研究学者尝试利用深度神经网络对问题和知识库知识进行短文本语义建模,并且通过计算两者之间的相似度去获得最匹配的知识作为问题的答案,这种基于向量建模的知识库问答方法不需要专家知识和人工干预,而且能保证一定的回答准确度,但是现有的向量建模方法仍有一些局限:知识库知识表示不够全面,缺少知识库信息;模型无法辨别字面相近的知识等,限制模型准确度的进一步提升。
另一方面,近年来图神经网络在自然语言处理领域取得了重大进展,推动了其在多跳文本问答任务中的发展。现有的基于图神经网络的多跳文本问答方法使用图卷积网络、图循环网络、图注意力网络等图神经网络通过在构建的实体图上进行推理得到文本中最相关的答案线索。但是这些方法只关注了文本中的实体信息;缺少对噪音句子的过滤等,从而降低了模型的推理能力。
另外,现有的智能问答技术很少研究利用多源异构信息源将两者结合起来进行优势互补的方法。
发明内容
(一)要解决的技术问题
针对于现有的技术问题,本发明提供一种面向多源异构数据源的智能问答方法及装置,用于至少部分解决以上技术问题。
(二)技术方案
本发明提供一种面向多源异构数据源的智能问答方法,包括:计算输入问题与候选关系的第一相似度,其中,候选关系为知识库中与输入问题相关的关系;根据第一相似度,从知识库中获取第一答案;根据输入问题检索多跳文本;计算多跳文本中的句子与输入问题之间的第二相似度以及多跳文本中的实体与输入问题之间的第三相似度;根据第二相似度及第三相似度,从多跳文本中获取第二答案;判定第一答案和第二答案的关系,输出输入问题的答案文本。
可选地,查询输入问题中的实体在知识库中的实体类型;获取知识库的层级信息和输入问题与候选关系的字面信息;根据实体类型、层级信息,以及字面信息计算输入问题与候选关系的第一相似度。
可选地,根据知识库的实体类型信息和层级信息,以及输入问题与候选关系的字面信息计算输入问题与候选关系的第一相似度,包括:去除输入问题中包含的实体,得到问题模板;整合实体类型的全局信息和局部信息的特征;计算特征整合后的实体类型和候选关系的相似度,得到第一相似度得分;分别对问题模板和候选关系进行语义匹配和字面匹配,计算问题模板和候选关系的相似度,得到第二相似度得分和第三相似度得分,其中,进行语义匹配,包括:基于知识库的层级信息,将候选关系分为分别映射实体和问题模板中的关系指代两个部分,来计算得到第二相似度得分。
可选地,根据第一相似度,从知识库中获取第一答案,包括:根据第一相似度得分,第二相似度得分和第三相似度得分得到与输入问题最匹配的候选关系,并根据与输入问题最匹配的候选关系对输入问题进行实体检测,得到主题实体,再根据主题实体得到第一答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院空天信息创新研究院,未经中国科学院空天信息创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110059191.9/2.html,转载请声明来源钻瓜专利网。





