[发明专利]一种多语种翻译方法、装置、存储介质及设备有效
| 申请号: | 202110550040.3 | 申请日: | 2021-05-20 |
| 公开(公告)号: | CN113343716B | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 俞鸿飞;兰田;侯培旭;富饶 | 申请(专利权)人: | 北京三快在线科技有限公司 |
| 主分类号: | G06F40/42 | 分类号: | G06F40/42;G06F40/58 |
| 代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
| 地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语种 翻译 方法 装置 存储 介质 设备 | ||
1.一种多语种翻译方法,其特征在于,包括:
获取原始文本,并确定目标文本对应的目标语种;
确定已获得的部分目标文本,作为参考文本;并,将所述原始文本输入预先训练的翻译模型的第一子模型的编码端,得到所述编码端输出的所述原始文本对应的编码特征,其中,所述已获得的部分目标文本为部分原始文本对应的翻译结果;
将所述编码特征和所述参考文本输入所述第一子模型的解码端,得到所述第一子模型的解码端输出的所述原始文本对应的文本特征;并,针对所述目标语种,在所述翻译模型包含的各线性层中确定与该目标语种对应的线性层;
将所述文本特征输入所述翻译模型中与所述目标语种对应的线性层,得到与所述目标语种对应的线性层输出的处理结果;
根据所述处理结果,获得部分目标文本,作为待参考文本;
根据所述已获得的部分目标文本和所述待参考文本重新确定参考文本,继续根据重新确定的参考文本获得部分目标文本,直至获得全部原始文本对应的全部目标文本为止。
2.如权利要求1所述的方法,其特征在于,所述翻译模型还包括Softmax层;
根据所述处理结果,获得部分目标文本,具体包括:
将所述处理结果输入所述Softmax层,得到所述Softmax层输出的所述处理结果对应的部分目标文本。
3.如权利要求1所述的方法,其特征在于,所述解码端至少包括:第一自注意力层、编解码注意力层、第一前馈子层;
将所述编码特征和所述参考文本输入所述解码端,得到所述解码端输出的所述原始文本对应的文本特征,具体包括:
将所述参考文本输入所述第一自注意力层,将所述第一自注意力层的输出结果输入到所述编解码注意力层;并,将所述编码特征输入所述解码端的编解码注意力层,以使所述编解码注意力层根据所述第一自注意力层的输出结果和所述编码特征得到输出结果;
将所述编解码注意力层的输出结果输入所述第一前馈子层,得到所述第一前馈子层输出的所述原始文本对应的文本特征。
4.如权利要求1所述的方法,其特征在于,预先训练翻译模型,具体包括:
确定各样本文本,以及各样本文本对应的标注文本;
针对每个样本文本,确定该样本文本对应的标注文本的目标语种;
将该样本文本输入翻译模型的第一子模型的编码端,得到所述编码端输出的该样本文本对应的样本编码特征;并,确定已获得的部分翻译文本,作为参考翻译文本,所述已获得的部分翻译文本为该样本文本中的部分文本对应的翻译结果;
将该样本编码特征和所述参考翻译文本输入所述翻译模型的第一子模型的解码端,得到所述解码端输出的该样本文本对应的样本文本特征;
根据所述目标语种,在所述翻译模型包含的各线性层中确定与该目标语种对应的线性层;
将该样本文本特征输入所述翻译模型中与所述目标语种对应的线性层,得到与所述目标语种对应的线性层输出的样本处理结果;
根据所述样本处理结果,获得部分翻译文本,作为待参考翻译文本;
根据所述已获得的部分翻译文本和所述待参考翻译文本重新确定参考翻译文本,继续根据重新确定的参考翻译文本获得部分翻译文本,直至获得该样本文本中的全部文本对应的翻译文本时,以所述翻译文本与该样本文本对应的标注文本之间的差异最小为训练目标,调整所述翻译模型中的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110550040.3/1.html,转载请声明来源钻瓜专利网。





