[发明专利]训练方法、装置、计算机设备和可读存储介质有效
| 申请号: | 201810694480.4 | 申请日: | 2018-06-29 |
| 公开(公告)号: | CN108846124B | 公开(公告)日: | 2022-05-17 |
| 发明(设计)人: | 崔少波;连荣忠;姜迪;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06F16/332;G06F40/211;G06F40/216 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 训练 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种训练方法,其特征在于,应用于对话生成网络,所述对话生成网络包括具有对偶关系的第一生成器和第二生成器,还包括第一判别器以及第二判别器;所述训练方法,包括:
对所述第一生成器输出的第一文本,采用所述第一判别器进行质量判别,得到第一判别信息;所述第一文本,是所述第一生成器根据对话上文输出的,用于回复所述对话上文;
对所述第二生成器输出的第二文本,采用所述第二判别器进行质量判别,得到第二判别信息;所述第二文本,是所述第二生成器根据对话下文输出的,用于作为上文接续在所述对话下文之前;
在所述对偶关系的约束下,根据所述第一判别信息对所述第一生成器进行训练,以及根据所述第二判别信息对所述第二生成器进行训练;其中,所述对偶关系由所述对话上文和所述对话下文的联合概率确定。
2.根据权利要求1所述的训练方法,其特征在于,所述在所述对偶关系的约束下,根据所述第一判别信息对所述第一生成器进行训练,以及根据所述第二判别信息对所述第二生成器进行训练,包括:
采用策略梯度算法,计算所述对偶关系关于第一生成器参数的梯度,得到所述第一生成器的策略梯度,以及计算所述对偶关系关于第二生成器参数的梯度,得到所述第二生成器的策略梯度;
根据所述第一文本与回复所述对话上文的期望文本之间的差异,以及根据所述第一判别信息,确定所述第一生成器的对抗梯度;
根据所述第二文本与作为上文接续在所述对话下文之前的期望文本之间的差异,以及根据所述第二判别信息,确定所述第二生成器的对抗梯度;
将所述第一生成器的对抗梯度与所述第一生成器的策略梯度合成,得到所述第一生成器的更新梯度;
将所述第二生成器的对抗梯度与所述第二生成器的策略梯度合成,得到所述第二生成器的更新梯度。
3.根据权利要求2所述的训练方法,其特征在于,所述采用策略梯度算法,计算所述对偶关系关于第一生成器参数的梯度,得到所述第一生成器的策略梯度,以及计算所述对偶关系关于第二生成器参数的梯度,得到所述第二生成器的策略梯度之前,还包括:
确定对话下文r在对话中出现的概率Pr(r);
确定对话上文q在对话中出现的概率Pq(q);
根据所述概率Pr(r)和概率Pq(q),确定所述对偶关系为其中,为将对话上文q输入采用参数θqr的第一生成器,得到第一文本的概率;为将对话下文r输入采用参数θrq的第二生成器,得到第二文本的概率。
4.根据权利要求3所述的训练方法,其特征在于,所述采用策略梯度算法,计算所述对偶关系关于第一生成器参数的梯度,得到所述第一生成器的策略梯度,以及计算所述对偶关系关于第二生成器参数的梯度,得到所述第二生成器的策略梯度,包括:
对所述对偶关系进行正则转化,得到损失函数γ,其中,
对所述损失函数γ计算关于所述第一生成器参数θqr的梯度,得到所述第一生成器的策略梯度
对所述损失函数γ计算关于所述第二生成器参数θrq的梯度,得到所述第二生成器的策略梯度
5.根据权利要求2所述的训练方法,其特征在于,所述根据所述第一文本与回复所述对话上文的期望文本之间的差异,以及根据所述第一判别信息,确定所述第一生成器的对抗梯度,包括:
根据将对话上文q输入采用参数θqr的第一生成器后,输出第一文本的概率,确定所述第一生成器的损失函数logP其中,所述损失函数logP取值,是根据所述第一文本与回复所述对话上文的期望文本之间的差异确定的;
根据所述第一判别信息,确定所述第一生成器参数θqr的调整方向D
根据所述第一生成器的参数调整方向D以及所述第一生成器的损失函数logP得到所述第一生成器的对抗梯度其中,b为常数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810694480.4/1.html,转载请声明来源钻瓜专利网。





