[发明专利]基于注意力机制的神经机器翻译方法及装置、设备有效
| 申请号: | 201910539986.2 | 申请日: | 2019-06-20 |
| 公开(公告)号: | CN110321567B | 公开(公告)日: | 2023-08-11 |
| 发明(设计)人: | 朱宪超 | 申请(专利权)人: | 四川语言桥信息技术有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58 |
| 代理公司: | 北京知果之信知识产权代理有限公司 11541 | 代理人: | 唐海力 |
| 地址: | 610000 四川省成都市中国(四川)自由贸易试验区*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 注意力 机制 神经 机器翻译 方法 装置 设备 | ||
1.一种基于注意力机制的神经机器翻译方法,其特征在于,包括:
获取翻译时源语言和目标语言,其中,所述源语言是指需要翻译的语言信息,所述目标语言是指翻译后的语言信息;
计算所述源语言和所述目标语言的距离张量,其中,所述距离张量是指距离权重;
在使用注意力机制计算对齐张量的过程中使用所述距离张量,以使神经机器翻译结果符合预期,其中,所述对齐张量采用对齐函数计算;
在使用注意力机制计算对齐张量的过程中使用所述距离张量包括:
将所述距离张量引入到注意力机制中计算,在基于注意力机制的输出对齐张量减去部分所述距离张量;
计算所述源语言和所述目标语言的距离张量包括:计算出所述距离参数并带入距离张量计算的过程;
所述计算出所述距离参数并带入距离张量计算的过程,包括:
将基于注意力函数输入张量的所述源语言词向量和所述目标语言词向量作为计算的初始量;
计算所述源语言词向量与所述目标语言词向量的欧式距离,得到距离张量;
对所述距离张量进行归一化处理后得到新的距离张量。
2.根据权利要求1所述的神经机器翻译方法,其特征在于,用于基于注意力机制的seq2seq框架模型。
3.一种基于注意力机制的神经机器翻译装置,其特征在于,包括:
获取模块,用于获取翻译时源语言和目标语言,其中,所述源语言是指需要翻译的语言信息,所述目标语言是指翻译后的语言信息;
计算模块,用于计算所述源语言和所述目标语言的距离张量,其中,所述距离张量是指距离权重;
代入模块,用于在使用注意力机制计算对齐张量的过程中使用所述距离张量,以使神经机器翻译结果符合预期,其中,所述对齐张量采用对齐函数计算;
所述代入模块用于将所述距离张量引入到注意力机制中计算,在基于注意力机制的输出对齐张量减去部分所述距离张量;
所述计算模块用于算出所述距离参数并带入距离张量计算的过程;
所述计算模块还用于,
将基于注意力函数输入张量的所述源语言词向量和所述目标语言词向量作为计算的初始量;
计算所述源语言词向量与所述目标语言词向量的欧式距离,得到距离张量;
对所述距离张量进行归一化处理后得到新的距离张量。
4.一种处理设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至2任一项所述的神经机器翻译方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川语言桥信息技术有限公司,未经四川语言桥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910539986.2/1.html,转载请声明来源钻瓜专利网。





