[发明专利]人机混合的应答方法、系统、装置有效
| 申请号: | 201910005704.0 | 申请日: | 2019-01-03 |
| 公开(公告)号: | CN109783704B | 公开(公告)日: | 2021-02-02 |
| 发明(设计)人: | 张家俊;王唯康;李志飞;宗成庆 | 申请(专利权)人: | 中国科学院自动化研究所;出门问问信息科技有限公司 |
| 主分类号: | G06F16/9032 | 分类号: | G06F16/9032 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 人机 混合 应答 方法 系统 装置 | ||
本发明属于人机对话技术领域,具体涉及一种人机混合的应答方法、系统、装置,旨在为了解决现有人机应答方法无法实现在线学习的问题。本发明方法包括:对当前对话上下文Ct进行编码,得到第一表征向量E(Ct);基于对话任务下的候选回复语句,并进行编码后得到第二表征向量基于第一表征向量E(Ct)、第二表征向量通过不确定性估计方法获取候选回复语句能够正确回复用户提问的置信度,置信度大于设定阈值则选择置信度对应的候选回复语句进行应答输出,否则获取通过人机交互设备录入的回复语句或选定的候选回复语句进行应答输出,并基于应答输出后得到的全部对话语句进行上述步骤中的参数优化。本发明保证了输出的应答语句具有足够的置信度,实现了对话模型的在线学习更新。
技术领域
本发明属于人机对话技术领域,具体涉及一种人机混合的应答方法、系统、装置。
背景技术
任务型对话系统是在某一特定领域,通过自然语言交互的形式,辅助用户完成任务的人机交互系统。设计数据驱动任务型对话系统的第一步是,定义该任务下用户的需求,然后根据定义好的用户需求收集相应的训练数据训练对话模型。
当对话系统部署到线上后,如果预先定义好的用户需求和真实用户的需求之间存在偏差,那么系统在遇到没有考虑到的需求时会给出不正确的回复。开发者通常可以通过更加详细的需求分析缓解这一问题。但是,开发者永远也无法保证所有的用户需求都被考虑在内。此外,由于自然语言的多样性,用户可以采用不同的方法表达相同的意图。这一现象导致,开发者无法保证所收集的训练数据覆盖了所有可能的情况。因此,采用有偏差的数据所训练的对话模型可能无法正确判断用户真实的意图。更糟糕的是,只有在问题发生之后,开发者才能通过人机交互记录发现这些错误。
发明内容
为了解决现有技术中的上述问题,即为了解决现有人机应答方法无法实现在线学习的问题,本发明的第一方面,提出了一种人机混合的应答方法,包括:
步骤S10,在一个对话任务中,对当前对话上下文Ct进行编码,得到第一表征向量E(Ct);所述当前对话上下文包括当前提问语句以及之前问答语句;t为当前对话的轮次;
步骤S20,基于步骤S10所述对话任务分类下的候选回复语句,分别进行编码后得到各候选回复语句对应的第二表征向量其中表示第t轮第i个候选回复语句;
步骤S30,基于第一表征向量E(Ct)、候选回复语句对应的第二表征向量通过不确定性估计方法获取候选回复语句能够正确回复用户提问的置信度,置信度大于设定阈值则执行步骤S40,否则执行步骤S50;
步骤S40,选择置信度最大的候选回复语句进行应答输出;
步骤S50,获取通过人机交互设备录入的回复语句或选定的候选回复语句进行应答输出;
步骤S60,基于步骤S50的应答输出后得到的全部对话语句构建目标函数,对对话模型进行优化,并利用优化后的参数对步骤S10-S50中的参数进行更新;所述对话模型依据步骤S10-S50构建。
在一些优选实施方式中,“基于步骤S50的应答输出后得到的全部对话语句对对话模型进行优化”,包括:
基于步骤S50应答输出的回复语句,将该回复语句添加至所述对话模型的回复语句集合中,构建对应对话任务的上下文回复数据依据该对话上下文构建所述对话模型的目标函数L′,通过该目标函数优化所述对话模型,并应用于步骤S20;
所述目标函数L′为,
L′=-L+αL1
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;出门问问信息科技有限公司,未经中国科学院自动化研究所;出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910005704.0/2.html,转载请声明来源钻瓜专利网。





