[发明专利]基于多文档的任务型人机对话任务的实现方法有效
| 申请号: | 202011355592.0 | 申请日: | 2020-11-27 |
| 公开(公告)号: | CN112328774B | 公开(公告)日: | 2022-10-25 |
| 发明(设计)人: | 刘含;袁彩霞;王小捷;刘咏彬;冯方向;李蕾 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/35;G06N3/04 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 孙清然;王琦 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 文档 任务 人机对话 实现 方法 | ||
1.一种基于多文档的任务型人机对话任务的实现方法,其特征在于,包括:
在人机对话过程中,当完成一轮对话时,拼接所述轮对话的提问信息和答复信息,得到所述轮对话的问答文本;
将所述问答文本输入至预先训练的人机对话任务模型中处理,得到下一轮对话的提问信息或者人机对话任务的执行结果,并在得到所述提问信息时,启动下一轮人机对话;其中,所述处理包括:
基于所述问答文本,生成所述轮对话的问答向量;计算所述问答向量与每个预设候选文档的属性相关向量的相似度;基于所述问答向量和所述相似度,生成所述轮对话中每个所述候选文档的概率分布,以及所述轮对话对应的属性分布;
根据每个所述候选文档的概率分布,更新当前的全局候选文档概率分布向量;根据所述轮对话对应的属性分布,更新当前的全局属性分布向量;
如果当前满足预设的人机对话结束条件,则将所述全局候选文档概率分布向量中的概率分布最大值对应的候选文档,作为人机对话任务的执行结果并输出;否则,基于所述全局候选文档概率分布向量和所述全局属性分布向量,利用预设的自然语言对话模板,确定下一轮对话的提问信息。
2.根据权利要求1所述的方法,其特征在于,所述基于所述问答文本,生成所述轮对话的问答向量包括:
将所述问答文本输入至双向长短期记忆网络进行编码,将所述双向长短期记忆网络输出的最后一个隐含层状态值,作为所述轮对话的问答向量。
3.根据权利要求1所述的方法,其特征在于,所述计算所述问答向量与每个预设候选文档的属性相关向量的相似度包括:
计算得到所述轮对话对应的相似度向量
其中,Gt为所述问答向量;Ws为所述人机对话任务模型的网络参数;Q为所有所述候选文档的属性相关向量的拼接结果;所述由所述问答向量与每个所述候选文档的所述相似度组成。
4.根据权利要求1所述的方法,其特征在于,生成所述轮对话中每个所述候选文档的概率分布,以及所述轮对话对应的属性分布包括:
基于所述问答向量,计算得到所述轮对话对应的属性类型其中,Wslot为所述人机对话任务模型中的网络参数,Gt为所述问答向量;softmax(·)表示归一化函数;
基于所述问答向量,计算σt=sigmoid(Winvalid·Gt),得到所述轮对话的答复有效值σt;其中Winvalid为所述人机对话任务模型中的网络参数;sigmoid(·)表示逻辑斯蒂函数;
将由所述问答向量对应的所有所述相似度组成的相似度向量在属性维度上与一个全1向量拼接,得到属性维度扩展后的相似度向量St;
按照得到所述轮对话在经过扩展的属性维度上的分布αt;
计算得到所述轮对话对应的候选文档概率分布向量其中,所述由所述轮对话中每个所述候选文档的概率分布值组成;
计算得到所述轮对话对应的属性分布
5.根据权利要求4所述的方法,其特征在于,所述更新当前的全局候选文档概率分布向量包括:
按照得到更新后的全局候选文档概率分布向量pt;其中,pt-1为更新前的全局候选文档概率分布向量;norm(·)表示L1归一化函数;
所述更新当前的全局属性分布向量包括:
按照得到更新后的全局属性分布向量πt;其中,πt-1为更新前的全局属性分布向量。
6.根据权利要求1所述的方法,其特征在于,所述人机对话结束条件包括:
所述全局的候选文档概率分布向量中的概率分布最大值大于预设概率阈值;或者,当前的对话轮数达到预设轮数阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011355592.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:遥监督关系抽取模型的训练方法及相关装置
- 下一篇:一种细菌病毒低温消杀装置





