[发明专利]在神经机器翻译中使用元信息在审
申请号: | 201780028072.9 | 申请日: | 2017-05-02 |
公开(公告)号: | CN109074242A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 叶夫根厄·马图索夫;陈文虎;沙赫拉姆·哈迪维 | 申请(专利权)人: | 电子湾有限公司 |
主分类号: | G06F7/00 | 分类号: | G06F7/00;G06F7/02;G06F7/10;G06F17/27;G06F17/28;G06F17/30;G06N3/04 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王洵 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络系统 元信息 机器翻译 输入文本 神经 处理器 翻译 文本 机器翻译系统 处理器执行 存储器 存储指令 系统执行 指令 输出 传递 补充 | ||
1.一种用于翻译文本的神经机器翻译系统,所述系统包括:
至少一个处理器;以及
存储指令的存储器,所述指令当由所述至少一个处理器中的至少一个处理器执行时,使得所述系统执行包括以下的操作:
获得文本作为神经网络系统的输入;
用元信息作为所述神经网络系统的额外输入来补充输入文本;以及
利用所述元信息进行翻译,将所述神经网络系统的输出作为所述输入文本的翻译传递给用户。
2.根据权利要求1所述的神经机器翻译系统,其中所述元信息包括电子商务列表的产品类别或主题。
3.根据权利要求1所述的神经机器翻译系统,其中所述神经机器翻译系统包括编码器-解码器架构,在所述编码器-解码器架构中,输入语句首先被编码为固定长度表示,并且所述解码器生成目标单词。
4.根据权利要求1所述的神经机器翻译系统,其中利用注意力机制训练所述系统,所述注意力机制在每个解码器步骤提供与源语句单词的软对齐。
5.根据权利要求1所述的神经机器翻译系统,其中所述操作还包括合并来自最后的递归神经网络解码器状态、最后的解码单词嵌入、当前上下文或注意力向量、以及输入特定元信息的向量表示的信息,以生成给所述用户的所述输出的至少一部分。
6.根据权利要求1所述的神经机器翻译系统,其中所述操作还包括单独地或组合地使用训练算法训练所述神经网络系统,所述训练算法利用与以下之一相关联的元信息:源语言语句和相关联的目标语言人工翻译的训练对,以及这种训练对的文档或语料库。
7.一种在神经机器翻译系统中的方法,包括:
获得文本作为神经网络系统的输入;
用元信息作为所述神经网络系统的额外输入来补充输入文本;以及
利用所述元信息进行翻译,将所述神经网络系统的输出作为所述输入文本的翻译传递给用户。
8.根据权利要求7所述的方法,其中所述元信息包括电子商务列表的产品类别或主题。
9.根据权利要求7所述的方法,还包括将输入语句编码成固定长度表示并且生成目标单词。
10.根据权利要求7所述的方法,其中还包括利用注意力机制训练所述神经机器翻译系统,以在一个或多个解码器操作中提供与源语句单词的软对齐。
11.根据权利要求7所述的方法,还包括:合并来自最后的递归神经网络解码器状态、最后的解码单词嵌入、当前上下文或注意力向量、以及输入特定元信息的向量表示的信息,以生成给所述用户的所述输出的至少一部分。
12.根据权利要求7所述的方法,还包括单独或组合地使用训练算法训练所述神经机器翻译系统,所述训练算法利用与以下一项或多项相关联的元信息:源语言语句和相关联的目标语言人工翻译的训练对,以及这种训练对的文档或语料库。
13.一种存储指令的机器可读存储介质,所述指令在由机器读取时使所述机器执行包括以下的操作:
获得文本作为神经网络系统的输入;
用元信息作为所述神经网络系统的额外输入来补充输入文本;以及
利用所述元信息进行翻译,将所述神经网络系统的输出作为所述输入文本的翻译传递给用户。
14.根据权利要求13所述的介质,其中所述元信息包括电子商务列表的产品类别或主题。
15.根据权利要求13所述的介质,其中所述操作还包括将输入语句编码为固定长度表示并且生成目标单词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子湾有限公司,未经电子湾有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780028072.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:液化石油气供应方法及系统
- 下一篇:专门处理块中的固定点和浮点算术运算器电路