[发明专利]一种基于翻译记忆库的神经机器翻译方法在审
| 申请号: | 202110661294.2 | 申请日: | 2021-06-15 | 
| 公开(公告)号: | CN113343717A | 公开(公告)日: | 2021-09-03 | 
| 发明(设计)人: | 杜权;杨迪 | 申请(专利权)人: | 沈阳雅译网络技术有限公司 | 
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/04;G06N3/08 | 
| 代理公司: | 沈阳新科知识产权代理事务所(特殊普通合伙) 21117 | 代理人: | 李晓光 | 
| 地址: | 110004 辽宁省沈阳市*** | 国省代码: | 辽宁;21 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 翻译 记忆 神经 机器翻译 方法 | ||
1.一种基于翻译记忆库的神经机器翻译方法,其特征在于包括以下步骤:
1)通过网络爬虫技术从含有外文数据的网络中爬取海量双语数据;
2)对双语数据进行清洗过滤、分词、子词切分预处理,得到处理后的双语数据;
3)将一半处理后的双语数据存储为翻译记忆库基础数据,另一半作为训练语料,使用搜索技术找到翻译记忆库中与训练语料中每个句子最相似的句子;
4)将训练语料数据和翻译记忆库数据一起输入到神经网络模型中开始训练模型至模型收敛;
5)导入用户自定义的数据到翻译记忆库中,形成更符合用户习惯的自定义翻译记忆库;
6)对用户实时输入的文本进行模糊搜索,找到翻译记忆库中与该文本最相似的句子,并一起输入到机器翻译模型中,在解码端使用门控机制指导模型翻译;
7)将用户输入的句子和修订后的结果存入翻译记忆库。
2.按权利要求1所述的基于翻译记忆库的神经机器翻译方法,其特征在于:步骤4)中,训练神经网络模型至模型收敛,具体为:
401)用双编码器结构分别对训练语料数据和翻译记忆库数据进行编码;
402)结合两种编码训练神经网络模型至模型收敛。
3.按权利要求1所述的基于翻译记忆库的神经机器翻译方法,其特征在于:步骤6)中,在机器翻译模型的解码端使用门控机制指导翻译,具体为:
601)将用户输入句子和翻译记忆查找结果一起输入翻译模型;
602)使用门控机制结合翻译记忆和源语句指导神经网络模型翻译,得到翻译结果;
603)门控机制计算具体公式为:
gtm=f(st-1,yt-1,csrc,ctm_t)
st-1为前置隐藏层状态,yt-1为前置预测目标词,csrc为用户输入句子,ctm_t为翻译记忆,f为激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳雅译网络技术有限公司,未经沈阳雅译网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110661294.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种瑞巴派特的制备方法
 - 下一篇:一种低输入需求的无叶涡轮机及其盘体
 





