[发明专利]用于优化对话模型的方法和装置在审
申请号: | 201811543401.6 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109635095A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 鲍思琪;何煌;王凡;吴华;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F17/27 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话模型 连贯性 语句 回复 方法和装置 测试语句 对话数据 模型参数 预设 对话 优化 输出 申请 | ||
本申请实施例公开了用于优化对话模型的方法和装置。该方法的一具体实施方式包括:将测试语句输入到使用对话数据集训练出的初始对话模型,生成回复语句;确定回复语句与包含测试语句的对话上文的上下文连贯性分值;若连贯性分值小于预设分值,调整初始对话模型的模型参数,继续训练初始对话模型。该实施方式提高了对话模型输出的回复语句与对话上文的连贯性。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于优化对话模型的方法和装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
最近几年,聊天机器人开始进入公众的视野。前沿的研究集中在聊天机器人如何根据自己的“系统画像”,表达机器人自己的一些特点,如年龄、性别等等。在与用户的交互中,机器人可以根据上文,通过匹配召回或者生成模型,产生回复内容。
发明内容
本申请实施例提出了用于优化对话模型的方法和装置。
第一方面,本申请实施例提供了一种用于优化对话模型的方法,该方法包括:将测试语句输入到使用对话数据集训练出的初始对话模型,生成回复语句;确定回复语句与包含测试语句的对话上文的上下文连贯性分值;若连贯性分值小于预设分值,调整初始对话模型的模型参数,继续训练初始对话模型。
在一些实施例中,确定回复语句与包含测试语句的对话上文的上下文连贯性分值,包括:将对话上文和回复语句输入到预先训练的语义评分模型,得到回复语句与对话上文的上下文连贯性分值。
在一些实施例中,语义评分模型通过如下步骤训练得到:获取训练样本集合,其中训练样本包括对话上文、回复语句以及标注信息,对话上文包括至少两个自然语句,标注信息包括训练样本中的回复语句与对话上文的上下文连贯性分值;将训练样本集合中的训练样本的对话上文和回复语句作为输入,将与输入的对话上文和回复语句对应的标注信息作为输出,训练得到语义评分模型。
在一些实施例中,该方法还包括:对回复语句进行语义分析,获取回复语句隐含的用户属性信息;确定获取到的用户属性信息与预设的用户属性信息集合中的用户属性信息是否一致;若获取到的用户属性信息与用户属性信息集合中用户属性信息不一致,调整初始对话模型的模型参数,继续训练初始对话模型。
在一些实施例中,该方法还包括:确定回复语句涉及的用户属性,以及统计用户属性在对话上文中被谈论的次数;若次数大于或等于预设数值,调整初始对话模型的模型参数,继续训练初始对话模型。
第二方面,本申请实施例提供了一种用于生成回复语句的方法,该方法包括:接收用户输入的自然语句;将自然语句输入到对话模型中,生成回复语句,其中对话模型是采用如第一方面任一实现方式描述的方法优化的模型。
在一些实施例中,将自然语句输入到对话模型中,生成回复语句,包括:从预设的用户画像集合中选取与对话记录匹配的用户画像;基于选取的用户画像确定用户的兴趣点;将自然语句输入到对话模型中,以及将兴趣点的向量表示作为对话模型的解码输入,得到用户感兴趣的回复语句。
第三方面,本申请实施例提供了一种用于优化对话模型的装置,该装置包括:语句生成单元,被配置成将测试语句输入到使用对话数据集训练出的初始对话模型,生成回复语句;分值确定单元,被配置成确定回复语句与包含测试语句的对话上文的上下文连贯性分值;第一调整单元,被配置成若连贯性分值小于预设分值,调整初始对话模型的模型参数,继续训练初始对话模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811543401.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成答案的方法和装置
- 下一篇:一种听写提示方法及电子设备