[发明专利]对话生成方法、系统、电子设备和可读存储介质在审
| 申请号: | 202011598612.7 | 申请日: | 2020-12-30 | 
| 公开(公告)号: | CN112307188A | 公开(公告)日: | 2021-02-02 | 
| 发明(设计)人: | 徐俊;雷泽阳;王海峰;牛正雨;吴华 | 申请(专利权)人: | 北京百度网讯科技有限公司 | 
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/951;G06F40/205 | 
| 代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 | 
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 对话 生成 方法 系统 电子设备 可读 存储 介质 | ||
1.一种对话生成方法,包括:
获取对话历史,并根据所述对话历史确定当前对话语句的对话状态,所确定的对话状态为对话引导状态与深入聊天状态中的一种,不同的对话状态对应于不同的模型;
在确定所述当前对话语句的对话状态为对话引导状态的情况下,将所述当前对话语句作为对话引导模型的输入,将所述对话引导模型的输出结果作为回复语句;
在确定所述当前对话语句的对话状态为深入聊天状态的情况下,将所述当前对话语句作为深入聊天模型的输入,将所述深入聊天模型的输出结果作为回复语句。
2.根据权利要求1所述的方法,其中,所述根据所述对话历史确定当前对话语句的对话状态包括:
将所述对话历史输入预先训练得到的状态识别模型,将所述状态识别模型的输出结果作为所述当前对话语句的对话状态。
3.根据权利要求1所述的方法,其中,所述根据所述对话历史确定当前对话语句的对话状态包括:
提取所述对话历史包含的对话语句中的关键词;
确定所提取的关键词满足的预设状态条件;
将与所确定的预设状态条件对应的对话状态,作为所述当前对话语句的对话状态。
4.根据权利要求1所述的方法,其中,所述将所述当前对话语句作为对话引导模型的输入,将所述对话引导模型的输出结果作为回复语句包括:
将所述当前对话语句输入所述对话引导模型中的对话检索模型,从所述对话检索模型的输出结果中选取预设个数的候选回复语句;
提取所述候选回复语句中的短语作为第一候选短语;
根据统一图谱,从所述第一候选短语中选取一个作为目标短语;
将所述目标短语输入所述对话引导模型中的回复生成模型,将所述回复生成模型的输出结果作为回复语句。
5.根据权利要求4所述的方法,其中,所述统一图谱采用以下方式预先构建得到:
获取开放域对话语料;
根据所述开放域对话语料构建开放域对话图谱;
将知识图谱中的实体链接添加到所述开放域对话图谱中的相应节点,得到所述统一图谱。
6.根据权利要求4所述的方法,其中,所述根据统一图谱从所述第一候选短语中选取一个作为目标短语包括:
提取所述当前对话语句中的短语作为第二候选短语;
根据统一图谱,从所述第一候选短语和所述第二候选短语中选取一个作为目标短语。
7.根据权利要求4或者6所述的方法,其中,根据统一图谱从候选短语中选取一个作为目标短语包括:
选取候选短语中与所述统一图谱中的预设的目标内容之间具有最近距离的短语作为目标短语。
8.根据权利要求1所述的方法,其中,所述将所述当前对话语句作为深入聊天模型的输入,将所述深入聊天模型的输出结果作为回复语句包括:
提取所述当前对话语句中的知识实体;
将所述当前对话语句与所提取的知识实体作为深入聊天模型的输入,将所述深入聊天模型的输出结果作为回复语句。
9.根据权利要求1或8所述的方法,其中,所述深入聊天模型采用以下方式预先训练得到:
获取开放域对话语料,并使用所述开放域对话语料训练得到初始对话生成模型;
获取知识对话语料,并在所述知识对话语料中添加闲聊语料之后,得到训练语料;
使用所述训练语料对所述初始对话生成 模型进行训练,得到所述深入聊天模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011598612.7/1.html,转载请声明来源钻瓜专利网。





