[发明专利]翻译模型的训练方法、装置、电子设备及存储介质有效
申请号: | 202111014476.7 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113807106B | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 万星;赵静璇;王梦雪;何中军;吴华;李芝;徐梓翔;刘继强;高鹏至;孙萌;李朝锡;姚伟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/166;G06N3/08;G06N20/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗岚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种翻译模型的训练方法,包括:
接收调整信息,所述调整信息,用于对已有翻译结果进行调整,所述已有翻译结果,是对待翻译信息翻译得到的;
根据所述调整信息和所述已有翻译结果,确定目标翻译结果,其中,将所述调整信息和所述已有翻译结果共同作为所述目标翻译结果;以及
根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型,其中,所述初始翻译模型的训练过程基于所述调整信息自动触发执行;
所述根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型,包括:
针对所述初始翻译模型预先配置损失函数,将模型输出的翻译结果和所述目标翻译结果作为损失函数的输入参数,并确定所述损失函数的输出值以作为损失值,将所述损失值与预先设定的损失阈值进行比对,以确定是否满足收敛时机,若判定模型收敛,则将训练得到的翻译模型作为所述目标翻译模型;
在所述根据所述调整信息和所述已有翻译结果,确定目标翻译结果之后,还包括:
获取初始翻译关系,所述初始翻译关系包括:多个候选翻译信息,和与所述多个候选翻译信息分别对应的多个候选翻译结果;
从所述多个候选翻译信息之中,确定与所述待翻译信息对应的候选翻译信息,并确定与所述对应的候选翻译信息所对应候选翻译结果;
将所述对应候选翻译结果调整为所述目标翻译结果,以得到目标翻译关系,所述目标翻译关系包括所述目标翻译结果和候选翻译信息之间建立的关联关系。
2.根据权利要求1所述的方法,其中,所述根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型,包括:
在所述根据所述调整信息对所述已有翻译结果进行调整时,根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型。
3.根据权利要求1所述的方法,其中,所述根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型,包括:
检测当前时间点;
如果所述当前时间点达到设定时间点,则根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型。
4.一种翻译模型的训练装置,包括:
接收模块,用于接收调整信息,所述调整信息,用于对已有翻译结果进行调整,所述已有翻译结果,是对待翻译信息翻译得到的;
确定模块,用于根据所述调整信息和所述已有翻译结果,确定目标翻译结果,其中,将所述调整信息和所述已有翻译结果共同作为所述目标翻译结果;以及
训练模块,用于根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型,其中,所述初始翻译模型的训练过程基于所述调整信息自动触发执行;
所述根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型,包括:
针对所述初始翻译模型预先配置损失函数,将模型输出的翻译结果和所述目标翻译结果作为损失函数的输入参数,并确定所述损失函数的输出值以作为损失值,将所述损失值与预先设定的损失阈值进行比对,以确定是否满足收敛时机,若判定模型收敛,则将训练得到的翻译模型作为所述目标翻译模型;
获取模块,用于在所述根据所述调整信息和所述已有翻译结果,确定目标翻译结果之后,获取初始翻译关系,所述初始翻译关系包括:多个候选翻译信息,和与所述多个候选翻译信息分别对应的多个候选翻译结果;
更新模块,用于根据所述目标翻译结果更新所述初始翻译关系,以得到目标翻译关系;
所述更新模块,具体用于:
从所述多个候选翻译信息之中,确定与所述待翻译信息对应的候选翻译信息,并确定与所述对应的候选翻译信息所对应候选翻译结果;
将所述对应候选翻译结果调整为所述目标翻译结果,以得到目标翻译关系,所述目标翻译关系包括所述目标翻译结果和候选翻译信息之间建立的关联关系。
5.根据权利要求4所述的装置,其中,所述训练模块,具体用于:
在所述根据所述调整信息对所述已有翻译结果进行调整时,根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111014476.7/1.html,转载请声明来源钻瓜专利网。