[发明专利]一种对话生成方法、装置以及电子设备有效
申请号: | 201710423859.7 | 申请日: | 2017-06-07 |
公开(公告)号: | CN107368524B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 常晓夫;巢林林;徐鹏;李小龙 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 王戈 |
地址: | 开曼群岛大开曼岛西湾路802号木槿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对话 生成 方法 装置 以及 电子设备 | ||
本申请公开了一种对话生成方法、装置以及电子设备。所述方法包括:利用包含话题范围约束信息的损失函数,对基于序列到序列的对话模型进行训练;利用所述训练过的对话模型,生成对话。利用本申请实施例,通过包含话题范围约束信息的损失函数,可以在对话模型训练过程中引入话题范围约束信息,从而有利于避免训练过的模型产出低质量无意义的回复。
技术领域
本申请涉及计算机软件技术领域,尤其涉及一种对话生成方法、装置以及电子设备。
背景技术
随着移动设备的快速发展,智能辅助相关的应用也变得越来越普遍。比如,越来越流行的对话助手,对话助手可以基于语音或者文字等形式,与用户进行对话,以回答用户提出的问题,或者单纯地陪用户聊天等。
在现有技术中,将对话过程的问和答看作是问题语言符号序列到答案语言符号序列的映射,以最大似然估计作为损失函数,采用大量的人工对话数据对基于序列到序列(sequence to sequence,seq2seq)的对话模型进行训练,使得该对话模型学习到问题语言符号序列到答案语言符号序列的映射关系,可以用训练过的对话模型自动生成对话,从而实现对话助手。
但是,上述现有技术在模型训练中容易受诸如“好的”、“是的”、“知道了”等无话题信息的高频回复语句影响,导致在实际使用训练过的模型时,也倾向与产出这些低质量无意义的回复。
发明内容
本申请实施例提供一种对话生成方法、装置以及电子设备,用以解决如下技术问题:现有技术在对话模型训练中容易受无话题信息的高频回复语句影响,导致在实际使用训练过的模型时,也倾向与产出这些低质量无意义的回复。
为解决上述技术问题,本申请实施例是这样实现的:
本申请实施例提供的一种对话生成方法,包括:
利用包含话题范围约束信息的损失函数,对基于序列到序列的对话模型进行训练;
利用所述训练过的对话模型,生成对话。
本申请实施例提供的一种对话生成装置,包括:
训练模块,利用包含话题范围约束信息的损失函数,对基于序列到序列的对话模型进行训练;
生成模块,利用所述训练过的对话模型,生成对话。
本申请实施例提供的一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
利用包含话题范围约束信息的损失函数,对基于序列到序列的对话模型进行训练;
利用所述训练过的对话模型,生成对话。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:通过利用包含话题范围约束信息的损失函数,在对话模型训练过程中引入话题范围约束信息,从而有利于避免训练过的模型产出低质量无意义的回复,因此,可以部分或全部地解决现有技术中的问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种对话生成方法的流程示意图;
图2为一种基于序列到序列的对话模型的原理示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710423859.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及系统
- 下一篇:搜索相关词的方法及装置、存储介质和终端设备