[发明专利]基于强化学习和机器翻译质量评估的中朝机器翻译方法有效

专利信息
申请号: 202110069256.8 申请日: 2021-01-19
公开(公告)号: CN112765996B 公开(公告)日: 2021-08-31
发明(设计)人: 赵亚慧;李飞雨;崔荣一;杨飞扬;王琪;金晶;金城;李丹阳;李路军;姜克鑫;高君龙;崔东虎 申请(专利权)人: 延边大学
主分类号: G06F40/51 分类号: G06F40/51;G06F40/58;G06N3/04;G06N3/08;G06N20/00
代理公司: 北京东方盛凡知识产权代理事务所(普通合伙) 11562 代理人: 王颖
地址: 133002 吉林省延*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 强化 学习 机器翻译 质量 评估 方法
【说明书】:

发明公开了基于强化学习和机器翻译质量评估的中朝机器翻译方法,主要包括以下步骤:将句子级别评价机制引入翻译模型中指导模型的训练,评价机制采用机器翻译质量评估,指导策略采用强化学习方法;机器翻译过程中,NMT系统作为强化学习的智能体,通过不断与环境进行交互获取当前时刻环境状态信息,根据当前环境的状态决策出下一步所选单词,同时获得当前状态执行选词操作后的奖励值,进入下一状态;通过机器翻译质量评估模型生成反馈信号,将机器翻译质量评估模型的输出作为奖励分数的一部分,所述模型通过网络结构对生成的译文进行全面评分。

技术领域

本发明属于计算机智能信息处理中的自然语言处理领域,特别是涉及一种基于强化学习和机器翻译质量评估的中朝机器翻译方法。

背景技术

机器翻译研究如何利用计算机自动地实现不同语言之间的相互转换,是自然语言处理和人工智能重要研究领域,也是目前互联网常用服务之一。虽然机器翻译译文与专业译员相比仍有较大差距,但是在一些对译文质量要求不高的场景下,或者是在特定领域翻译任务上,机器翻译在翻译速度上具有明显优势,仍然得到广泛应用。鉴于机器翻译的复杂性和应用前景,学术界和产业界都把该领域作为重点研究方向,成为当前自然语言处理最活跃的研究领域之一。

由于自然语言处理的多样性和复杂性,将一种语言恰如其分地翻译成另一种语言仍然困难重重。目前,在大规模语料和计算能力条件下,神经机器翻译展现出巨大潜力,已经发展成为一种新的机器翻译方法。这种方法仅需要双语平行语料,便于训练大规模翻译模型,不仅具有很高的研究价值,同时也具有很强的产业化能力,成为当前机器翻译研究的前沿热点。

我国是统一的多民族国家,各少数民族语言类型和形态丰富,并且存在语言类型跨度大,语言资源匮乏、语言处理基础技术薄弱等问题。这些问题的存在使得目前成熟的一些机器翻译方法对少数民族语言和韩语之间的翻译并不适用。实际上,我国少数民族语言和汉语之间的自动翻译技术面临很多复杂的科学问题,如形态丰富语言的机器翻译,资源匮乏语言的机器翻译等,这些也是目前机器翻译研究的重要内容。虽然近年来神经机器翻译技术快速发展并且成为机器翻译研究的主流技术,但是,国内少数民族语言机器翻译方面的相关研究主要集中在蒙古语、藏语、维吾尔语等少数民族语言中。

朝鲜语是我国朝鲜族的官方语言,同时通行于朝鲜半岛、美国、俄罗斯远东地区等朝鲜族聚居地区,具有跨国跨地区的特点。朝鲜族是我国24个拥有自己语言的少数民族之一,因此中朝机器翻译的研究,对促进少数民族语言文字工作的发展、推动中朝、中韩跨语言信息交流具有重要的现实意义和迫切的时代需求。然而对于中朝机器翻译而言,中朝语言对之间缺乏大规模的平行语料,属于低资源语言。国内对该任务的研究起步晚、基础差,缺少大规模语料资源库。在低资源环境下提升中朝机器翻译质量面临巨大挑战。

发明内容

本发明通过将机器翻译质量评级引入中朝机器翻译模型,有效解决了传统神经机器翻译模型使用教师强制策略带来的曝光偏差和译文多样性差的问题,并通过有效设置采样策略、奖励函数和损失函数极大地稳定了训练过程,实现模型性能提升最大化。

为实现上述目的,本发明提供了如下方案:

基于强化学习和机器翻译质量评估的中朝机器翻译方法,包括以下步骤:

将句子级别评价机制引入翻译模型中指导模型的训练,评价机制采用机器翻译质量评估,指导策略采用强化学习方法,机器翻译过程中,NMT系统作为强化学习的智能体,通过不断与环境进行交互获取当前时刻环境状态信息,根据当前环境的状态决策出下一步所选单词,同时获得当前状态执行选词操作后的奖励值,进入下一状态;

通过机器翻译质量评估模型生成反馈信号,将所述机器翻译质量评估模型的输出作为奖励分数QE的一部分,所述机器翻译质量评估模型通过网络结构对生成的译文进行全面评分;

采用基于波束搜索的动作采样策略,将从词表中选取候选词看作一个动作,通过解码器生成目标句后环境给出的奖励来学习得到分数最高时对应的译文。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于延边大学,未经延边大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110069256.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top