[发明专利]限定性神经网络机器翻译方法及存储介质有效
申请号: | 201810961909.1 | 申请日: | 2018-08-22 |
公开(公告)号: | CN109359304B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 田亮;黎浩添 | 申请(专利权)人: | 新译信息科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/044;G06N3/0455;G06N3/047;G06N3/08 |
代理公司: | 深圳市辉泓专利代理有限公司 44510 | 代理人: | 袁辉;刘玉珍 |
地址: | 518000 广东省深圳市南山区前海深港合作区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 限定性 神经网络 机器翻译 方法 存储 介质 | ||
一种限定性神经网络机器翻译方法及存储介质,包括下述步骤:1、训练基本的NMT模型;2、使用该NMT模型翻译一个即验证集,并输出ATTENTION LAYER里的词对齐信息;3、使用词性标注器进行词性自动标注,然后利用词对齐信息自动生成UNK2语料;4、把原本语料数据加上UNK2语料并重新训练;5、使用替换功能時,把需要替换的词先换成UNK2语料,进行解码后,再利用词对齐信息替换回去;6、完成UNK替换解码过程。通过本发明可解决NMT对于UNK替换的技术效果不理想的缺点,针对性的流程可以大幅地增加替换的成功机率同时保持高质的翻译质量,本发明应用了UNK替换功能,保证名词翻译的准确度。
技术领域
本发明公开一种翻译方法,特别是一种限定性神经网络机器翻译方法及存 储介质。
背景技术
从事翻译相关工作的人员大多会遇到下述问题:
(1)是否为当前神经网络机器翻译莫名的译文结果苦恼?
(2)是否为翻译过程中的数字问题感到头疼?
(3)是否因为术语等关键词翻译错误而被客户指责?
(4)是否因为政治新闻翻译的敏感性而望而却步?
(5)是否想充分干预机器翻译的前处理和后编译,实现高效率翻译的目 标?
(6)是否想自动的添加手中留存的宝贵的术语库,得到你想要的译文结 果?
翻译是一个艺术和工程的完美结合的过程,也是一种沟通传达的一种方式。 神经网络机器翻译较传统的统计机器翻译译文质量有了极大的提高,然而一旦 涉及到术语等关键信息,我们往往得到的译文往往是词不达意的。
事实上,语言服务从业人员更希望用更少的工程脑力,来达到最终的准确 译文的目的。
在翻译的过程中,包括口译和笔译,如果把一句话中的关键信息(主从关 系、数字、日期、人名、地名、机构名、货币等)表达出来,就能基本达到沟 通的目的。如果把原文中的关键词(软件设计中的算法工程师叫:命名实体) 替换成想要的准确译文,不就能实现准确翻译的目的吗,有这么麻烦吗?但是, 在实际应用中,却绝非如此。
我们想翻译一句话,比如:
澳门皇冠假日酒店委托我来翻译这篇文章。
只需要,把“澳门皇冠假日酒店”替换成事先准备的术语“Crowne Plaza Macau”,就大功告成,稍作修改就得到想要的译文:
Crowne Plaza Macau委托我来翻译这篇文章。
Crowne PlazaMacau commissioned me to translate this article.
但是现在的结果是:
Crowne Plaza Macao commissioned me to translate this article.
系统“悄悄地”修改了译文,没有实现我们指定的译文!
在传统基于短语的统计机器翻译等系统中,数字或者专有名词,可以简单 地把这些词原封不动的复制到翻译句子中,但是在神经网络机器翻译中,这样 的操作就无法有效的进行。要理解这些,先要理解机器翻译的进程和简单的原 理。
1、机器翻译进化
以人工智能(AI)为代表的新科技、以消费升级为代表的新理念、以实体 经济为代表的新政策,正在深刻改变中国创业创新的方向和内涵,2018年将是 许多人工智能技术落地之年。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新译信息科技(深圳)有限公司,未经新译信息科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810961909.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图模型的词义消歧方法和系统
- 下一篇:一种多语言同声互译的方法和设备