[发明专利]一种机器翻译方法及其装置在审
| 申请号: | 202010388975.1 | 申请日: | 2020-05-09 |
| 公开(公告)号: | CN113627199A | 公开(公告)日: | 2021-11-09 |
| 发明(设计)人: | 翁荣祥;于恒;骆卫华 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/126;G06N3/04 |
| 代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈 |
| 地址: | 开曼群岛大开曼*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 机器翻译 方法 及其 装置 | ||
1.一种机器翻译方法,其特征在于,包括:
接收源语言的源文本;
将所述源文本输入编码器,利用编码器中的各个子编码器输出的隐藏表示,生成所述编码器的编码输出,其中,每个子编码器包括至少一个神经网络层;
利用解码器对所述编码输出执行解码,获取目标语言的目标文本。
2.如权利要求1所述的方法,其特征在于,接收源语言的源文本后还包括:
对所述源文本执行分词处理,获取到所述源文本的各个输入分词;
将每个输入分词执行词嵌入处理,获取到各个输入分词的输入分词向量;
所述将所述源文本输入编码器包括:
将所述输入分词向量输入到编码器。
3.如权利要求2所述的方法,其特征在于,将所述源文本输入编码器,利用编码器中的各个子编码器输出的隐藏表示,生成所述编码器的编码输出包括:
将所述编码器按照神经网络层的层数划分为多个子编码器;
利用所述多个子编码器对所述输入分词向量执行处理,获取到每个子编码器输出的隐藏表示;
利用每个子编码器输出的隐藏表示,生成编码器的编码输出。
4.如权利要求3所述的方法,其特征在于,利用所述多个子编码器对所述输入分词向量执行处理获取到每个子编码器输出的隐藏表示包括:
针对每个子编码器,将从当前子编码器输输入的输入分词向量和前一子编码器的输出信息作为输入信息执行处理,从而获取到与多个子编码器分别对应的多个隐藏表示。
5.如权利要求3所述的方法,其特征在于,利用每个子编码器输出的隐藏表示生成编码器的编码输出包括:
通过确定每个隐藏表示的权重生成编码器的编码输出。
6.如权利要求5所述的方法,其特征在于,通过确定每个隐藏对应的权重生成编码器的编码输出包括:
利用注意力机制确定每个隐藏表示的权重;
根据每个隐藏表示以及对应的权重确定所述编码输出。
7.如权利要求1所述的方法,其特征在于,利用每个子编码器输出的隐藏表示,生成编码器的编码输出包括:
将每个子编码器输出的隐藏表示作为单个序列数据输入到针对序列数据的神经网络层,将输出的序列数据作为所述编码器的编码输出。
8.如权利要求7所述的方法,其特征在于,所述针对序列数据的神经网络层包括循环神经网络。
9.如权利要求8所述的方法,其特征在于,所述解码器包括多个子解码器,其中,所述多个子解码器的数量不受子编码器的数量约束。
10.如权利要求9所述的方法,其特征在于,利用解码器对所述编码输出执行解码获取目标语言的目标文本包括:
将所述编码输出输入到解码器中的各个子解码器,每个子解码器利用上一子解码器解码的输出以及对应的编码输出执行解码并将解码的输出输入到下一子解码器,依次执行处理,将最后的子解码器的输出作为所述目标文本。
11.一种机器翻译方法,其特征在于,包括:
接收源语言的源文本;
将所述源文本输入到经过训练的机器翻译模型中,获取目标语言的目标文本,其中,所述机器翻译模型包括编码器和解码器,其中,所述编码器包括多个子编码器,利用所述多个子编码器输出的多个隐藏表示表示的编码输出用作解码器的输入。
12.一种机器翻译装置,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-11所述的方法中的任一方法的指令。
13.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1-11所述的方法中的任一方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010388975.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全网络化光盘库集群
- 下一篇:卫星空间信号异常的探测方法及系统





