[发明专利]一种翻译方法及装置在审
| 申请号: | 202010688296.6 | 申请日: | 2020-07-16 |
| 公开(公告)号: | CN113947092A | 公开(公告)日: | 2022-01-18 |
| 发明(设计)人: | 翁荣祥;于恒;骆卫华 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F40/56 | 分类号: | G06F40/56;G06F40/44;G06F40/58 |
| 代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 李秀霞 |
| 地址: | 开曼群岛大开曼*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 翻译 方法 装置 | ||
1.一种翻译方法,包括:
以源语言语句及其对应的目标语言语句为训练样本,训练生成第一翻译模型;
将所述源语言语句输入所述第一翻译模型,以得到所述源语言语句的翻译结果;
通过将所述翻译结果与相应的目标语言语句进行比对,确定所述翻译结果中的误译片段及其对应的误译源片段;
以包含误译源片段的源语言语句及其对应的目标语言语句为训练样本,以降低误译片段的产生概率为训练目标,对所述第一翻译模型进行训练,生成第二翻译模型。
2.如权利要求1所述的方法,其中,所述通过将所述翻译结果与相应的目标语言语句进行比对,确定所述翻译结果中的误译片段及其对应的误译源片段的步骤包括:
将所述翻译结果中的词与相应目标语言语句中的词进行匹配,确定所述翻译结果中的误译词,误译词的集合为所述误译片段;
采用预设的词对齐模型,从源语言语句中确定对应于所述误译词的误译源词,误译源词的集合为所述误译源片段。
3.如权利要求1或2所述的方法,其中,所述第一翻译模型包括编码模块、注意力模块和解码模块,
所述编码模块适于对源语言语句进行编码,生成所述源语言语句中各词的隐向量表示;
所述注意力模块适于生成所述源语言语句的权重矩阵,所述权重矩阵包括所述源语言语句中的各词对生成翻译结果中各词的权重;
所述解码模块适于根据所述权重矩阵,对所述隐向量表示进行解码,以生成所述源语言语句的翻译结果。
4.如权利要求3所述的方法,其中,所述以降低误译片段的产生概率为训练目标,对所述第一翻译模型进行训练,生成第二翻译模型的步骤包括:
以降低误译片段的产生概率为目标,分别设置编码模块、注意力模块、解码模块对应的第一目标函数、第二目标函数、第三目标函数;
以最小化第一目标函数、第二目标函数、第三目标函数、第四目标函数的加权求和结果为训练目标,对所述第一翻译模型进行训练,生成第二翻译模型,其中,所述第四目标函数为训练生成第一翻译模型时所采用的目标函数。
5.如权利要求4所述的方法,其中,所述第一目标函数为:
其中,N为所述误译源片段所包括的词的数量,x为源语言语句,xM为误译源片段,xi为误译源片段中的第i个误译源词,x\xM为正确源片段,所述正确源片段为源语言语句中除误译源片段之外的词的集合,P(xi|x\xM)为在正确源片段x\xM的条件下生成误译源词xi的概率。
6.如权利要求5所述的方法,其中,在正确源片段的条件下生成误译源词的概率按照以下步骤确定:
将源语言语句中的误译源词按照预设概率替换为掩码词,生成掩码语句;
将所述掩码语句输入所述编码模块,以便所述编码模块输出每个误译源词位置的词的隐向量表示;
根据源语言的词向量表,确定所述隐向量表示为相应误译源词的概率。
7.如权利要求4所述的方法,其中,所述第二目标函数为:
其中,I、J分别为权重矩阵的行、列数量,ai,j、bi,j分别为当前权重矩阵、词对齐矩阵中的第i行、第j列的元素值,所述词对齐矩阵为根据误译源词与误译词的对应关系对所述当前权重矩阵进行修正所得到的矩阵。
8.如权利要求7所述的方法,其中,所述词对齐矩阵按照以下步骤确定:
对于每一个误译词,将当前权重矩阵中的相应误译源词到该误译词的权重设置为1,源语言语句中的其他词到该误译词的权重设置为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010688296.6/1.html,转载请声明来源钻瓜专利网。





