[发明专利]一种可学习未来信息的机器翻译方法在审

专利信息
申请号: 202210016283.3 申请日: 2022-01-07
公开(公告)号: CN114528853A 公开(公告)日: 2022-05-24
发明(设计)人: 杜权;刘兴宇;张秋林 申请(专利权)人: 沈阳雅译网络技术有限公司
主分类号: G06F40/58 分类号: G06F40/58;G06N3/04;G06N3/08
代理公司: 沈阳新科知识产权代理事务所(特殊普通合伙) 21117 代理人: 李晓光
地址: 110004 辽宁省沈阳市*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 学习 未来 信息 机器翻译 方法
【权利要求书】:

1.一种可学习未来信息的机器翻译方法,其特征在于包括以下步骤:

1)采用基于自注意力机制的Transformer模型作为基础框架,在解码器端加入未来信息网络模块,用于学习句子的未来信息,构建一种可学习未来信息的机器翻译模型;

2)处理训练数据,对源语和目标语平行句对进行数据清洗、分词,并利用现有的词嵌入模型,将得到的相应词转换成其对应的词嵌入表示;

3)使用均匀分布对可学习未来信息的机器翻译模型进行参数初始化,使用自适应学习率算法进行模型训练优化;

4)在编码器中,首先利用自注意力机制对词嵌入进行计算,随后将计算得到的值送入可学习未来信息的机器翻译模型中的前馈神经网络以获得词嵌入向量中更多的信息,此操作进行n次后,该模型即学到了句子的特征信息;

5)可学习未来信息的机器翻译模型利用编解码注意力机制学习源语与目标语之间的关联信息,同时编码器的信息也被送入可以学习未来信息网络结构中,以辅助解码器学习句子的未来信息;最后,未来信息网络将学到的信息送回解码器,辅助解码器解码;

6)利用训练好的可学习未来信息的机器翻译模型进行机器翻译,在翻译过程中,该模型仅使用基础的Transformer解码器进行解码,实现可学习未来信息的机器翻译方法。

2.按权利要求1所述的一种可学习未来信息的机器翻译方法,其特征在于:在步骤1)中,在解码器端加入未来信息网络模块,用于学习句子的未来信息,未来信息网络的算法流程为:

101)对未来信息进行线性变换:

zi=GRU(zi-1,hi-1)

其中zi是第i句的未来句子信息,zi-1是第i-1句的未来句子信息,hi-1是第i-1句的循环单元状态,GRU是门控循环单元;

102)将未来信息与当前状态信息融合:

oi=sigmoid(ziW+b)

其中oi是门控信息,用于学习需要保留多少比例的未来句子信息zi,sigmoid(·)是激活函数,W和b是模型可学习的参数,yi是当前状态,是融合了未来信息后的当前状态;

103)将当前状态与编码器信息进行融合,以学习源语言到目标语言的关联信息:

其中是未来信息网络的输出值,attention(·)是注意力机制算法,是融合了未来信息后的当前状态,xi是编码器所捕获的特征值。

3.按权利要求2所述的一种可学习未来信息的机器翻译方法,其特征在于:在步骤101)中,使用门控循环单元GRU对信息进行线性变换,该结构由重置门和更新门构成,重置门用来控制前一时刻隐层状态的信息比例,公式如下:

rt=sigmoid([ht-1,xt]Wr)

其中rt表示前一时刻隐层信息需要保留的比例,ht-1是前一时刻的隐层信息,xt是当前时刻的输入,Wr是可训练的权重参数;

更新门用来更新记忆信息,其计算公式如下:

ut=sigmoid([ht-1,xt]Wu)

其中ut是更新门得到的权重值,Wu是可训练的权重参数;

之后,利用计算得到的rt和ut更新当前时间步的隐藏状态,其具体计算公式如下:

其中是包含前一时刻隐层状态与当前时刻信息的值,Wh是可训练的权重参数,tanh(·)是激活函数,ht是当前时刻的隐层状态信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳雅译网络技术有限公司,未经沈阳雅译网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210016283.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top