[发明专利]神经机器翻译模型的构建方法及装置、翻译方法及装置在审

专利信息
申请号: 201811259546.3 申请日: 2018-10-26
公开(公告)号: CN111104806A 公开(公告)日: 2020-05-05
发明(设计)人: 黄輝;刘学博;周沁;刘洋 申请(专利权)人: 澳门大学
主分类号: G06F40/58 分类号: G06F40/58;G06N3/08
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 王莹;李相雨
地址: 中国澳门*** 国省代码: 澳门;82
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 神经 机器翻译 模型 构建 方法 装置 翻译
【权利要求书】:

1.一种神经机器翻译模型的构建方法,其特征在于,包括:

基于编码器-解码器框架构建神经机器翻译模型,所述神经机器翻译模型包括编码器和解码器;

其中,所述解码器在生成目标词汇时,依次生成与目标词汇对应的第一属性向量和第二属性向量,然后再由所述第一属性向量和所述第二属性向量组成一个属性向量对映射到相应的目标词汇。

2.根据权利要求1所述的方法,其特征在于,所述解码器在生成目标词汇时,依次生成与目标词汇对应的第一属性向量和第二属性向量,具体包括:

通过源语句的隐藏状态序列、与当前目标词汇对应的上下文向量、当前目标词汇的前一目标词汇的第二属性隐藏状态和第二属性向量得到当前目标词汇的第一属性隐藏状态;

通过与当前目标词汇对应的上下文向量、当前目标词汇的第一属性隐藏状态和第一属性向量得到当前目标词汇的第二属性隐藏状态;

基于当前目标词汇的第一属性隐藏状态计算当前目标词汇对应各个第一属性向量的概率;

基于当前目标词汇的第二属性隐藏状态计算当前目标词汇对应各个第二属性向量的概率;

按照目标词汇的顺序,根据计算得到的所有目标词汇对应各个第一属性向量的概率和对应各个第二属性向量的概率确定各个目标词汇的第一属性向量和第二属性向量。

3.根据权利要求2所述的方法,其特征在于,所述基于当前目标词汇的第一属性隐藏状态计算当前目标词汇对应各个第一属性向量的概率,通过如下公式实现:

其中,表示对应于第j个目标词汇,第一实数矩阵中第m行的第一属性向量的概率;表示所述第一实数矩阵中第m行的第一属性向量;为计算过程中间变量;表示所述第一实数矩阵中第i行的第一属性向量;w(1)为训练第一属性向量的模型训练参数,M为所述第一实数矩阵的行数;为第j个目标词汇的第一属性隐藏状态;为第j-1个目标词汇的第二属性向量;cj为第j个目标词汇的上下文向量;

所述基于当前目标词汇的第二属性隐藏状态计算当前目标词汇对应各个第二属性向量的概率,通过如下公式实现:

其中,表示对应于第j个目标词汇,第二实数矩阵中第n行的第二属性向量的概率;表示所述第二实数矩阵中第n行的第二属性向量;为计算过程中间变量;表示所述第二实数矩阵中第l行的第二属性向量;w(2)为训练第二属性向量的模型训练参数,N为所述第二实数矩阵的行数;为第j个目标词汇的第二属性隐藏状态;为第j个目标词汇的第一属性向量;cj为第j个目标词汇的上下文向量。

4.根据权利要求1所述的方法,其特征在于,所述按照目标词汇的顺序,根据计算得到的所有目标词汇对应各个第一属性向量的概率和对应各个第二属性向量的概率确定各个目标词汇的第一属性向量和第二属性向量,具体包括:

按照概率的高低,存储与各个目标词汇对应的预设数量的第一属性向量和第二属性向量;

在满足相邻目标词汇对应的属性向量的制约关系下,计算所有目标词汇对应各个第一属性向量的概率和对应各个第二属性向量的概率的乘积,取乘积最大时各个目标词汇所对应的第一属性向量和第二属性向量为最后所确定的各个目标词汇所对应的第一属性向量和第二属性向量。

5.根据权利要求1所述的方法,其特征在于,所述方法还包括对神经机器翻译模型进行训练,所述对神经机器翻译模型进行训练具体包括:

在对所述神经机器翻译模型进行训练的过程中收集预设特征,并在模型收敛时暂停训练;

根据收集的所述预设特征对训练集中的目标词汇和属性向量对进行重映射;

使用重映射后的属性向量对继续训练所述神经机器翻译模型;

重复上述步骤直至达到预设的训练时间或训练次数时终止训练。

6.根据权利要求5所述的方法,其特征在于,在对神经机器翻译模型进行训练之前,所述方法还包括:

分别建立第一实数矩阵和第二实数矩阵,所述第一实数矩阵包括第一属性向量,所述第二实数矩阵包括第二属性向量;

将训练集中的目标词汇分别映射到一对初始的第一属性向量和第二属性向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于澳门大学,未经澳门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811259546.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top