[发明专利]一种融合双语词典的蒙汉神经机器翻译方法在审
申请号: | 202111113235.8 | 申请日: | 2021-09-23 |
公开(公告)号: | CN113850090A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 仁庆道尔吉;庞蕊;程坤;尹玉娟;张倩;张文静;苏依拉;吉亚图 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/242;G06N3/04;G06N3/08 |
代理公司: | 武汉菲翔知识产权代理有限公司 42284 | 代理人: | 李慧奇 |
地址: | 010051 内蒙古*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种融合双语词典的蒙汉神经机器翻译方法,通过在NMT系统中增加离散的翻译词典,意在解决NMT在翻译低频实词时经常出错的问题。首先构造词典概率,对于平行语料库中的词汇对,使用IBM模型通过无监督方式进行自动学习,对未被平行语料库覆盖的但收录于手制词典中的词汇对,定义翻译集并假设其为均匀分布;然后在编码阶段将词典概率转换为条件预测概率,然后将此预测概率与NMT模型的概率整合到一起,本发明使用两种整合方式:其一为;将其作为偏置、其二为;线性插值。 | ||
搜索关键词: | 一种 融合 双语 词典 神经 机器翻译 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111113235.8/,转载请声明来源钻瓜专利网。