[发明专利]一种基于融合统计机器翻译模型的蒙汉神经机器翻译方法在审
申请号: | 202111112986.8 | 申请日: | 2021-09-23 |
公开(公告)号: | CN113850089A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 仁庆道尔吉;庞蕊;张倩;文丽霞;刘永超;张毕力格图;李雷孝;萨和雅 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/04;G06N3/08 |
代理公司: | 武汉菲翔知识产权代理有限公司 42284 | 代理人: | 李慧奇 |
地址: | 010051 内蒙古*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 融合 统计 机器翻译 模型 神经 方法 | ||
1.一种基于融合统计机器翻译模型的蒙汉神经机器翻译方法,其特征在于:具体包括以下步骤:
S1、NMT分类器继承标准的基于注意力的NMT后在规则词表上估计单词的预测概率;
S2、SMT分类器计算由辅助SMT模型生成的SMT建议的概率;
S3、将SMT建议整合到NMT中。
2.根据权利要求1所述的一种基于融合统计机器翻译模型的蒙汉神经机器翻译方法,其特征在于:所述S1中标准的基于注意力的NMT的翻译过程为,给定源句子NMT将其编码为一个向量序列,之后使用该向量序列生成目标句子
3.根据权利要求2所述的一种基于融合统计机器翻译模型的蒙汉神经机器翻译方法,其特征在于:所述基于注意力的NMT使用一个由正向RNN和反向RNN组成的双向RNN对源句子进行编码,其中正向RNN顺序阅读源句子x,生成一个正向的隐藏状态序列反向RNN则反向阅读源句子x并生成一个反向的隐藏状态序列将每个位置的隐藏状态对串联起来,形成该位置的单词注释,从而得到整个源句的注释,其中
4.根据权利要求2所述的一种基于融合统计机器翻译模型的蒙汉神经机器翻译方法,其特征在于:所述在解码的时间步t,输出目标序列y<t=y1,y2,...,yt-1之后,下一个单词yt由下式所示条件概率生成:p(yt|y<t,x)=softmax(f(st,yt-1,ct)),其中f(·)为非线性激活函数,st是时间步t时解码器的隐藏状态:st=g(st-1,yt-1,ct),其中g(·)为非线性激活函数,此处使用门控循环单元作为编码器和解码器的激活函数;ct是上下文向量,由源句子注释的加权和计算而得:其中hj为源单词xj的注释,其权重αt,j由注意力模型计算而得。
5.根据权利要求1所述的一种基于融合统计机器翻译模型的蒙汉神经机器翻译方法,其特征在于:所述S2中的所述统计机器翻译模型由对数线性框架定义:其中hm(y,x)为特征函数,λm为它的权重。在翻译过程中,SMT解码器通过从双语短语表中为未翻译的源句子部分选择合适的目标词或短语翻译来扩展局部翻译y<t=y1,y2,...,yt-1(在SMT中称为翻译假设)。
6.根据权利要求1或5所述的一种基于融合统计机器翻译模型的蒙汉神经机器翻译方法,其特征在于:所述S2中的实现方式为:给定NMT生成的词y<t=y1,y2,...,yt-1,SMT生成下一个单词的建议,并用下式计算建议分数:其中yt是SMT的一个建议,xt是对应的源跨度,hm(yt,xt)是特征函数,λm是其权重,SMT模型可以通过扩展生成的单词来生成适当的单词推荐(局部翻译)。
7.根据权利要求1所述的一种基于融合统计机器翻译模型的蒙汉神经机器翻译方法,其特征在于:所述S3中采用两种策略来过滤低质量的建议以保证SMT建议的质量:①根据翻译分数,仅保留前Ntm的源词翻译,翻译分数作为翻译概率的权重和进行计算;②选择最高SMT得分的前Nrec的建议,每一个都作为SMT特征的加权和进行计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111112986.8/1.html,转载请声明来源钻瓜专利网。