[发明专利]基于神经网络模型的翻译方法及翻译系统在审

专利信息
申请号: 202210184687.3 申请日: 2022-02-28
公开(公告)号: CN114510952A 公开(公告)日: 2022-05-17
发明(设计)人: 余畅;张方元;杨攀;杨尚为;杨子辰 申请(专利权)人: 盐城睿行空间企业孵化器有限公司
主分类号: G06F40/58 分类号: G06F40/58;G06F40/289;G06N3/04
代理公司: 北京汉德知识产权代理事务所(普通合伙) 11328 代理人: 钱莺勤
地址: 224200 江苏省盐城*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 神经网络 模型 翻译 方法 系统
【说明书】:

基于神经网络模型的翻译方法,包括下列步骤:构建编码器‑解码器网络架构的神经网络翻译模型。利用编码器将原文编码。解码器在解码位置生成Beam的过程中利用注意力机制判断当前解码位置是否对齐到带术语的原文。若是则采用Dynamic Beam Allocation算法的动态分配机制生成当前位置的Beam,并且仅分配对应原文术语的译文。若否则采用Beam Search算法生成当前位置的Beam。利用解码器从最后一个Beam回溯全部路径,选取评分最高的路径,将路径上的候选词连接在一起生成译文。该翻译方法能够根据术语表提供译文,并兼顾翻译的效率和质量。本发明还提供了一种采用上述翻译方法的翻译系统。

技术领域

本发明涉及一种翻译方法,尤其涉及一种基于神经网络模型的翻译方法。本发明还涉及一种采用上述翻译方法的翻译系统。

背景技术

当前多数机器翻译引擎基于神经网络模型构建,采用编码器-解码器(Encoder-Decoder)框架,其中编码器(Encoder)将原文中的词(子词)编码为向量,解码器(Decoder)接收编码器编码的信息,加上注意力机制,结合解码器已输出的译文向量,使用集束搜索(Beam Search)算法输出译文。由于目前的机器翻译技术是按句子来翻译的,因此无法保证原文中的术语在不同句子中得到准确一致的翻译。为解决上述问题,提出了一种新的算法动态束分配(Dynamic Beam Allocation,DBA),然而DBA算法的缺陷在于固定大小的Beam中的可分配空间有限,而束(Beam)中被分配的术语词过多,限制了模型的输出能力,影响了输出译文的质量。

发明内容

本发明的目的是提供一种基于神经网络模型的翻译方法,能够根据术语表提供译文,并兼顾翻译的效率和质量。

本发明的另一个目的是提供一种基于神经网络模型的翻译系统,能够根据术语表提供译文,并兼顾翻译的效率和质量。

本发明提供了一种基于神经网络模型的翻译方法,包括下列步骤:

构建编码器-解码器网络架构的神经网络翻译模型;

利用编码器将原文编码为编码向量;

解码器在解码位置利用编码向量生成Beam的过程中利用注意力机制输出对齐分数,判断当前解码位置是否对齐到带术语的原文位置;

若是则解码器在解码位置采用Dynamic Beam Allocation算法的动态分配机制生成当前位置的Beam,并且仅分配对应原文术语的译文;

若否则解码器在解码位置则采用Beam Search算法生成当前位置的Beam;

利用解码器从最后一个Beam回溯全部路径,选取评分最高的路径,将路径上的候选词连接在一起生成译文。

本发明提供的基于神经网络模型的翻译方法,在解码器解码过程中,利用注意力机制生成对齐信息,预判用户指定的术语译文的输出位置,优化了Dynamic BeamAllocation 算法的Beam分配机制,在不降低解码速度的前提下,提升了Dynamic BeamAllocation 算法的译文输出质量。借此使机器翻译引擎能够根据术语表提供译文,并兼顾翻译的效率和质量。

在基于神经网络模型的翻译方法的一种示意性方式中,利用如下公式计算注意力机制的对齐分数:

其中,n表示编码器输出的编码向量的维度,hi表示编码器在i位置输出的编码向量,St表示解码器在t位置的编码向量。

在基于神经网络模型的翻译方法的一种示意性方式中,Dynamic BeamAllocation算法的动态分配机包括步骤:

生成候选词集合,候选词集合包括采用Beam Search算法在上一个Beam生成的数个候选词结果、所有当前解码路径未覆盖的术语起始词和术语表中前一位置候选词的接续词;以及

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盐城睿行空间企业孵化器有限公司,未经盐城睿行空间企业孵化器有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210184687.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top