[发明专利]基于双向依存自注意力机制的低资源神经机器翻译方法在审
申请号: | 202111078629.4 | 申请日: | 2021-09-15 |
公开(公告)号: | CN113901845A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 赖华;李治瑾;文永华;高盛祥;余正涛 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/49;G06F40/289;G06F40/205 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双向 依存 注意力 机制 资源 神经 机器翻译 方法 | ||
1.基于双向依存自注意力机制的低资源机器翻译方法,其特征在于,所述方法的具体步骤如下:
Step1、爬取互译的平行语料,通过人工筛选并对齐得到平行句对;
Step2、对处理好的平行语料进行分词、依存解析和BPE,其中对双语数据进行分词和BPE,但只对源语言端进行依存解析,解析后得到源语言的依存标记;
Step3、在Step2的基础上,将双向依存信息融合到Transformer模型中,得到具有双向依存自注意力机制的Transformer模型,再对处理好的平行语料进行训练,得到训练好的具有双向依存自注意力机制的Transformer模型;
Step4、在Step3的基础上,利用训练好的具有双向依存自注意力机制的Transformer模型在测试集上进行翻译,得到翻译结果后利用BLUE值作为评价指标对翻译质量进行评估。
2.根据权利要求1所述的基于双向依存自注意力机制的低资源神经机器翻译方法,其特征在于:所述Step1中通过互联网爬取互译的汉泰平行语料,人工筛选出106万个平行句对,并为所有的翻译任务中构建1.6万的BPE词典。
3.根据权利要求1所述的基于双向依存自注意力机制的低资源神经机器翻译方法,其特征在于:所述Step2中对处理好的平行语料进行分词和依存解析,解析后得到源语言句子中子词到父词位置信息,构建父词位置向量,再利用父词位置信息即可得到父词到子词方向遍历的全部子词依存信息且无需利用外部依存解析工具,从而构建子词权重矩阵,得到双向依存信息。
4.根据权利要求1所述的基于双向依存自注意力机制的低资源神经机器翻译方法,其特征在于:所述Step3将子词到父词方向和父词到子词方向的双向依存信息融合到Transformer多头注意力机制中,对多头注意力机制进行更改,通过融合父词位置向量和子词权重矩阵,构建双向依存自注意力机制,利用双向依存信息为模型提供更全面的结构信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111078629.4/1.html,转载请声明来源钻瓜专利网。