[发明专利]一种多语种翻译方法、装置、存储介质及设备有效
| 申请号: | 202110550040.3 | 申请日: | 2021-05-20 |
| 公开(公告)号: | CN113343716B | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 俞鸿飞;兰田;侯培旭;富饶 | 申请(专利权)人: | 北京三快在线科技有限公司 |
| 主分类号: | G06F40/42 | 分类号: | G06F40/42;G06F40/58 |
| 代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
| 地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语种 翻译 方法 装置 存储 介质 设备 | ||
本说明书公开了一种多语种翻译方法、装置、存储介质及设备,本方法先获取原始文本,在确定了原始文本对应的目标文本的目标语种后,根据目标语种,在翻译模型包含的多个线性层中,确定与该目标语种对应的线性层,将原始文本输入翻译模型的第一子模型中,可确定原始文本对应的文本特征,再将文本特征输入上述确定出的线性层中,根据该线性层的输出结果确定目标文本。本方法在需要将原始文本翻译成多个语种的情况下,仅需训练并使用一个翻译模型就可将原始文本翻译至目标文本,而并不需要训练多个模型,大大节省了训练模型的成本。
技术领域
本说明书涉及计算机技术领域,尤其涉及一种多语种翻译方法、装置、存储介质及设备。
背景技术
随着世界的全球化发展,用户在使用各类客户端时,往往会遇到搜索出的内容的文字是其他语种的情况,为了让用户知道搜索出的内容的意思,客户端会将当前的文字转换至用户的母语文字。
在现有技术中,常使用机器翻译来解决上述问题,即通过计算机将一种自然语言(源语言)翻译成另外一种自然语言(目标语言)。其中最常见的机器翻译技术为神经机器翻译模型。神经机器翻译模型会将当前文字(源语言)转换成对应的向量并输入至该模型中,通过神经机器翻译模型的每一层对输入的向量进行转换,得到目标语言。
但是,一个神经机器翻译模型只能将一种自然语言翻译成另一种指定语种的自然语言,即只能进行一对一的语言翻译,如果需要将源语言翻译成其他多个语种的目标语言,还需要再训练多个模型。因此,如何使用一个模型就能够将一种自然语言翻译成其他多个语种的自然语言是个亟待解决的问题。
发明内容
本说明书提供一种多语种翻译方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种多语种翻译方法,包括:
获取原始文本,并确定目标文本对应的目标语种;
将所述原始文本输入预先训练的翻译模型的第一子模型,得到所述第一子模型输出的所述原始文本对应的文本特征;并,针对所述目标语种,在所述翻译模型包含的各线性层中确定与该目标语种对应的线性层;
将所述文本特征输入所述翻译模型中与所述目标语种对应的线性层,得到与所述目标语种对应的线性层输出的处理结果;
根据所述处理结果,获得目标文本。
可选地,所述翻译模型还包括Softmax层;
根据所述处理结果,获得目标文本,具体包括:
将所述处理结果输入所述Softmax层,得到所述Softmax层输出的所述处理结果对应的目标文本。
可选地,所述第一子模型至少包括编码端和解码端;
将所述原始文本输入预先训练的翻译模型的第一子模型,得到所述第一子模型输出的所述原始文本对应的文本特征,具体包括:
确定已获得的部分目标文本,作为参考文本;并,将所述原始文本输入所述编码端,得到所述编码端输出的所述原始文本对应的编码特征;其中,所述已获得的部分目标文本为部分原始文本对应的翻译结果;
将所述编码特征和所述参考文本输入所述解码端,得到所述解码端输出的所述原始文本对应的文本特征;
将所述文本特征输入所述翻译模型中与所述目标语种对应的线性层,得到与所述目标语种对应的线性层输出的处理结果,具体包括:
将所述文本特征输入所述翻译模型中与所述目标语种对应的线性层,得到与所述目标语种对应的线性层输出的处理结果;
根据所述处理结果,获得部分目标文本,作为待参考文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110550040.3/2.html,转载请声明来源钻瓜专利网。





