[发明专利]一种融合乌尔都语词性序列预测的翻译方法在审
申请号: | 202310094936.4 | 申请日: | 2023-02-09 |
公开(公告)号: | CN116090479A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 陈欢欢;王剑;张迁 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/08;G06N3/0455 |
代理公司: | 成都明涛智创专利代理有限公司 51289 | 代理人: | 毕雅凤 |
地址: | 650000 云南*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 乌尔都语 词性 序列 预测 翻译 方法 | ||
本发明涉及翻译方法领域,尤其是涉及一种融合乌尔都语词性序列预测的翻译方法,其步骤如下:S1.构建Transformer模型;S2.根据词性序列预测模型;S3.在翻译模型内融入词性序列预测信息;S4.分别对词性序列预测模型和翻译模型进行训练。本申请中提出的融合乌尔都语词性序列信息的汉乌神经机器翻译,将预测目标语的词性序列信息融入翻译模型中,最终结果相较于基准模型提升了BLEU值。
技术领域
本发明涉及翻译方法领域,尤其是涉及一种融合乌尔都语词性序列预测的翻译方法。
背景技术
随着信息技术的快速发展,机器翻译作为自然语言处理的重要组成部分得到广泛的应用与发展。近年来,由于计算机计算能力的快速提升及深度学习算法的提出,神经机器翻译取得了良好的结果,在大规模平行语料的基础上,能够有效的学习各种语言的特点。然而乌尔都语与汉语在句法结构上存在较大的差异,乌尔都语属于印欧语系,其句子主干成分的语序基本均为主宾谓(SOV),其次乌尔都语的语序结构相对自由,例如图1所示,部分词在句中位置并不唯一,这些都影响着传统翻译方法的效果。
语言的差异性对机器翻译系统的性能有着不可忽略的影响。因此本申请中提出了一种融合乌尔都语词性序列预测的翻译方法。
发明内容
本发明的目的在于提供了一种融合乌尔都语词性序列预测的翻译方法,利用Transformer预先预测目标语言乌尔都语的词性序列,将其做为先验知识融入翻译模型,利用翻译模型和序列预测模型联合预测。
为实现上述目的,本发明提供如下技术方案:
一种融合乌尔都语词性序列预测的翻译方法,其步骤如下:
S1.构建Transformer模型;
S2.根据词性序列预测模型;
S3.在翻译模型内融入词性序列预测信息;
S4.分别对词性序列预测模型和翻译模型进行训练。
进一步的,所述步骤S2中对目标词的词性预测的步骤如下:
A.在模型编码端输入源语,解码端输入目标和目标语对应词性序列;
B.输出下一个目标词的词性预测;
C.给予词性预测结果与翻译模型词预测结果联合预测下一个目标词;
D.将预测的目标词同时输入翻译模型和词性预测模型的解码端,预测下一个目标词,直至预测到结束标签;
E.得到源语的对应翻译语句。
进一步的,所述步骤S3中融入词性的步骤如下:
A.利用统计方法构建词性标签与词表相互关联的矩阵;
B.将词性序列的预测结果与翻译模型的结果相互融合。
与现有技术相比,本发明的有益效果是:
本申请中提出的融合乌尔都语词性序列信息的汉乌神经机器翻译,将预测目标语的词性序列信息融入翻译模型中,最终结果相较于基准模型提升了BLEU值。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1是本发明背景技术中的示例:我不能走;
图2是本发明中的系统流程图;
图3是本发明中的汉-乌翻译模型;
图4是本发明中的Transformer模型结构;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310094936.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种海报生成的方法和装置
- 下一篇:一种电站电除尘钢架稳定性的智慧型检测方法