[发明专利]人机混合的应答方法、系统、装置有效
| 申请号: | 201910005704.0 | 申请日: | 2019-01-03 |
| 公开(公告)号: | CN109783704B | 公开(公告)日: | 2021-02-02 |
| 发明(设计)人: | 张家俊;王唯康;李志飞;宗成庆 | 申请(专利权)人: | 中国科学院自动化研究所;出门问问信息科技有限公司 |
| 主分类号: | G06F16/9032 | 分类号: | G06F16/9032 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 人机 混合 应答 方法 系统 装置 | ||
1.一种人机混合的应答方法,其特征在于,包括:
步骤S10,在一个对话任务中,对当前对话上下文Ct进行编码,得到第一表征向量E(Ct);所述当前对话上下文包括当前提问语句以及之前问答语句;t为当前对话的轮次;
步骤S20,基于步骤S10所述对话任务分类下的候选回复语句,分别si进行编码后得到各候选回复语句对应的第二表征向量其中表示第t轮第i个候选回复语句;
步骤S30,基于第一表征向量E(Ct)、候选回复语句对应的第二表征向量通过不确定性估计方法获取候选回复语句能够正确回复用户提问的置信度,置信度大于设定阈值则执行步骤S40,否则执行步骤S50;
步骤S40,选择置信度对应的候选回复语句进行应答输出;
步骤S50,获取通过人机交互设备录入的回复语句或选定的候选回复语句进行应答输出;
步骤S60,基于步骤S50的应答输出后得到的全部对话语句构建目标函数,对对话模型进行优化,并利用优化后的参数对步骤S10-S50中的参数进行更新;所述对话模型依据步骤S10-S50构建。
2.根据权利要求1所述的一种人机混合的应答方法,其特征在于,“基于步骤S50的应答输出后得到的全部对话语句对对话模型进行优化”,包括:
基于步骤S50应答输出的回复语句,将该回复语句添加至所述对话模型的回复语句集合中,构建对应对话任务的上下文回复数据依据该对话上下文构建所述对话模型的目标函数L′,通过该目标函数优化所述对话模型;
所述目标函数L′为,
L′=-L+αL1
其中,L为上下文回复数据dk最大化数据似然的变分下界、L1为上下文回复数据dk的聚类损失;α是个超参数;Ck为第k轮的对话上下文,包括第k轮提问语句以及之前问答语句;为第k轮录入的回复语句。
3.根据权利要求1或2所述的人机混合的应答方法,其特征在于,步骤S30中“通过不确定性估计方法获取候选回复语句能够正确回复用户提问的置信度”,其方法为:
步骤S31,基于第一表征向量E(Ct)得到当前对话上下文下隐变量的先验分布;
步骤S32,基于当前对话上下文下隐变量的先验分布获取隐变量z;
步骤S33,根据第一表征向量E(Ct)、候选回复语句对应的第二表征向量隐变量z,计算各候选回复语句的回复概率,并根据回复概率采样一个候选回复语句;
步骤S34,对步骤S32、步骤S33进行m次重复,获取采样出来的回复列表L={r1,r2,...,rm};将回复列表L中采样频率最大的候选回复语句的出现频次作为置信度。
4.根据权利要求3所述的人机混合的应答方法,其特征在于,步骤S33中“计算各候选回复语句的回复概率”,其方法为:
其中,表示第t轮采用候选回复语句的回复概率,表示第t轮第i个候选回复语句;softmax()为归一化指数函数,为第t轮采用候选回复语句的回复打分值,W为权重参数矩阵。
5.根据权利要求3所述的人机混合的应答方法,其特征在于,所述隐变量z,其计算方法为:
z=μ+σ·ε
其中,μ为当前对话上下文下隐变量的先验分布的均值;σ为当前对话上下文下隐变量的先验分布的方差的算数平方根;ε为标准高斯分布中采样的随机变量,每次计算隐变量z时的ε通过重新采样获得。
6.根据权利要求3任一项所述的人机混合的应答方法,其特征在于,步骤S33“根据回复概率采样一个候选回复语句”,其方法为:依据计算出来的回复概率进行随机采样,采样的结果作为输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;出门问问信息科技有限公司,未经中国科学院自动化研究所;出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910005704.0/1.html,转载请声明来源钻瓜专利网。





