[发明专利]基于知识库的答案生成方法、装置和智能会话系统在审
申请号: | 201811617454.8 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109783624A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 刘欣然;李杨;胡长建 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F17/27;G06N5/04 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨静 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识库 会话系统 知识数据 答案生成 知识实体 智能 关联关系信息 候选关系 候选实体 输入语句 答案数据 反馈信息 匹配结果 输入信息 匹配 输出 响应 应用 | ||
本公开提供了一种基于知识库的答案生成方法,应用于智能会话系统中,该智能会话系统能够对接收到的输入信息进行响应并提供反馈信息。知识库包括多条知识数据,所述知识数据包括知识实体信息以及所述知识实体信息的关联关系信息。该方法包括:获取输入语句数据;将所述输入语句数据分别与候选关系集和候选实体集进行匹配,其中,所述候选关系集由所述知识库中的知识数据的关联关系信息构成,所述候选实体集由所述知识库中的知识数据的知识实体信息构成;以及,根据匹配结果,输出答案数据。本公开还提供了一种基于知识库的答案生成装置和智能会话系统。
技术领域
本公开涉及一种基于知识库的答案生成方法、装置和智能会话系统。
背景技术
随着关系抽取,知识表示等知识图谱相关技术的发展,基于开放领域知识库的问答逐渐成为自然语言处理领域中的一个重要课题,其主流解决思路可分为基于语义句法分析和基于信息抽取两种。
现有基于知识库的问答系统中,往往将知识库中的知识数据看作一个整体进行语义分析或匹配,在特征提取不充分或训练数据不足时,容易出现失配,表现为尽管知识本身正确,但对用户输入“答非所问”,造成了最终答案选择的偏差。
发明内容
本公开的一个方面提供了一种基于知识库的答案生成方法,该方法应用于智能会话系统中,智能会话系统能够对接收到的输入信息进行响应并提供反馈信息。所述知识库包括多条知识数据,所述知识数据包括知识实体信息以及所述知识实体信息的关联关系信息。上述方法包括:获取输入语句数据;将所述输入语句数据分别与候选关系集和候选实体集进行匹配,其中,所述候选关系集由所述知识库中的知识数据的关联关系信息构成,所述候选实体集由所述知识库中的知识数据的知识实体信息构成;以及,根据匹配结果,输出答案数据。
可选地,在上述将输入语句数据分别与候选关系集和候选实体集进行匹配之前,上述方法还包括:识别输入语句数据的关键实体信息;从所述知识库中获取包含所述关键实体信息的知识数据;以及,利用所获取的知识数据中的关联关系信息构建候选关系集,利用所获取的知识数据中的除所述关键实体信息之外的知识实体信息构建候选实体集。
可选地,上述将所述输入语句数据分别与候选关系集和候选实体集进行匹配包括:将所述输入语句数据与所述候选关系集进行第一匹配,得到与所述候选关系集中的各关联关系信息对应的第一匹配评分;将所述输入语句数据与所述候选实体集进行第二匹配,得到与所述候选实体集中的各知识实体信息对应的第二匹配评分;以及,基于所述第一匹配评分和所述第二匹配评分,确定最优知识数据。则上述根据匹配结果,输出答案数据包括:将所述最优知识数据中的知识实体信息作为与所述输入语句数据对应的答案数据。
可选地,上述将所述输入语句数据与所述候选关系集进行第一匹配包括:获取所述输入语句数据的特征向量;获取所述候选关系集中的各关联关系信息的第一向量;以及,对于所述候选关系集中的任一关联关系信息,将该关联关系信息的第一向量与所述输入语句数据的特征向量输入第一匹配模型,基于所述第一匹配模型计算该关联关系信息的第一向量与所述输入语句数据的特征向量之间的第一匹配度。其中,所述第一匹配模型是利用多组由问题样本数据和与该问题样本数据对应的关系样本数据组成的样本对训练得到的。
可选地,第一匹配模型包括:基于孪生网络的句子编码模型,或者,引入注意力机制的基于信息交互的匹配模型。
可选地,上述将所述输入语句数据与所述候选实体集进行第二匹配包括:获取所述输入语句数据的特征向量;获取所述候选实体集中的各知识实体信息的第二向量;对于所述候选实体集中的任一知识实体信息,将该知识实体信息的封闭词向量与所述输入语句数据的特征向量输入第二匹配模型,基于所述第二匹配模型计算该知识实体信息的封闭词向量与所述输入语句数据的特征向量之间的第二匹配度。其中,第二匹配模型是利用多组由问题样本数据和与该问题样本数据对应的答案样本数据组成的样本对训练得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811617454.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种真实场景下用户与客服对话的数据分析方法
- 下一篇:交互方法和计算设备