[发明专利]一种可学习未来信息的机器翻译方法在审
申请号: | 202210016283.3 | 申请日: | 2022-01-07 |
公开(公告)号: | CN114528853A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 杜权;刘兴宇;张秋林 | 申请(专利权)人: | 沈阳雅译网络技术有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/04;G06N3/08 |
代理公司: | 沈阳新科知识产权代理事务所(特殊普通合伙) 21117 | 代理人: | 李晓光 |
地址: | 110004 辽宁省沈阳市*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 学习 未来 信息 机器翻译 方法 | ||
1.一种可学习未来信息的机器翻译方法,其特征在于包括以下步骤:
1)采用基于自注意力机制的Transformer模型作为基础框架,在解码器端加入未来信息网络模块,用于学习句子的未来信息,构建一种可学习未来信息的机器翻译模型;
2)处理训练数据,对源语和目标语平行句对进行数据清洗、分词,并利用现有的词嵌入模型,将得到的相应词转换成其对应的词嵌入表示;
3)使用均匀分布对可学习未来信息的机器翻译模型进行参数初始化,使用自适应学习率算法进行模型训练优化;
4)在编码器中,首先利用自注意力机制对词嵌入进行计算,随后将计算得到的值送入可学习未来信息的机器翻译模型中的前馈神经网络以获得词嵌入向量中更多的信息,此操作进行n次后,该模型即学到了句子的特征信息;
5)可学习未来信息的机器翻译模型利用编解码注意力机制学习源语与目标语之间的关联信息,同时编码器的信息也被送入可以学习未来信息网络结构中,以辅助解码器学习句子的未来信息;最后,未来信息网络将学到的信息送回解码器,辅助解码器解码;
6)利用训练好的可学习未来信息的机器翻译模型进行机器翻译,在翻译过程中,该模型仅使用基础的Transformer解码器进行解码,实现可学习未来信息的机器翻译方法。
2.按权利要求1所述的一种可学习未来信息的机器翻译方法,其特征在于:在步骤1)中,在解码器端加入未来信息网络模块,用于学习句子的未来信息,未来信息网络的算法流程为:
101)对未来信息进行线性变换:
zi=GRU(zi-1,hi-1)
其中zi是第i句的未来句子信息,zi-1是第i-1句的未来句子信息,hi-1是第i-1句的循环单元状态,GRU是门控循环单元;
102)将未来信息与当前状态信息融合:
oi=sigmoid(ziW+b)
其中oi是门控信息,用于学习需要保留多少比例的未来句子信息zi,sigmoid(·)是激活函数,W和b是模型可学习的参数,yi是当前状态,是融合了未来信息后的当前状态;
103)将当前状态与编码器信息进行融合,以学习源语言到目标语言的关联信息:
其中是未来信息网络的输出值,attention(·)是注意力机制算法,是融合了未来信息后的当前状态,xi是编码器所捕获的特征值。
3.按权利要求2所述的一种可学习未来信息的机器翻译方法,其特征在于:在步骤101)中,使用门控循环单元GRU对信息进行线性变换,该结构由重置门和更新门构成,重置门用来控制前一时刻隐层状态的信息比例,公式如下:
rt=sigmoid([ht-1,xt]Wr)
其中rt表示前一时刻隐层信息需要保留的比例,ht-1是前一时刻的隐层信息,xt是当前时刻的输入,Wr是可训练的权重参数;
更新门用来更新记忆信息,其计算公式如下:
ut=sigmoid([ht-1,xt]Wu)
其中ut是更新门得到的权重值,Wu是可训练的权重参数;
之后,利用计算得到的rt和ut更新当前时间步的隐藏状态,其具体计算公式如下:
其中是包含前一时刻隐层状态与当前时刻信息的值,Wh是可训练的权重参数,tanh(·)是激活函数,ht是当前时刻的隐层状态信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳雅译网络技术有限公司,未经沈阳雅译网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210016283.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种减少误差测量煤场存煤的方法
- 下一篇:浅埋煤层矸石运-充-压一体化装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置