[发明专利]基于周期函数的机器翻译输出修正方法及系统有效
申请号: | 202011550194.4 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112686027B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 李真;闫红刚;谢超杰;李静涛;何振华;屈丹;储相瑞 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院 |
主分类号: | G06F40/237 | 分类号: | G06F40/237;G06F40/58;G06N3/0455 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 周期函数 机器翻译 输出 修正 方法 系统 | ||
本发明属于人工智能翻译技术领域,涉及一种基于周期函数的机器翻译输出修正方法及系统,方法包含:获取源语言和目标语言两者对应的平行语料,对词汇进行编码得到字典表和对应的索引值;对源语言语句和位置信息进行编码,通过编码器神经网络获取信息编码,并利用周期函数对信息编码特征进行提取,获取编码器神经网络最终输出;对目标语言语句和位置信息进行编码,将编码结果和编码器神经网络最终输出作为解码器神经网络输入,利用周期函数对解码器神经网络输出特征进行提取来获取解码器神经网络最终输出;将解码器神经网络最终输出经过特征映射获取字典表中索引编号,最终输出为索引编号对应词汇。本发明能够有效提升机器翻译质量和用户体验度。
技术领域
本发明属于人工智能翻译技术领域,特别涉及一种基于周期函数的机器翻译输出修正方法及系统。
背景技术
随着经济社会的发展,政府和民间交流、商务活动日益增多,涉及到外文翻译需求越来越多,语种也更加多样化;互联网的蓬勃发展,也使得人们获取信息的范围、渠道、方式、形式也日趋多样,信息量成爆炸式增长。此时,人工翻译受限于实效性差、翻译人员水平参差不齐、小语种资源稀缺、成本高等原因,已无法满足需求,机器翻译具有高速度、低成本、多语种覆盖的特点,且翻译质量趋近“信、雅、达”,是必然趋势。
发明内容
为此,本发明提供一种基于周期函数的机器翻译输出修正方法及系统,在神经网络机器翻译使用梯度下降优化的基础上,利用周期函数提升神经元获取的有效特征信息,在解决神经网络在梯度下降过程中特征信息损失过量等问题,提升机器翻译质量和用户体验度。
按照本发明所提供的设计方案,一种基于周期函数的机器翻译输出修正方法,用于改善机器翻译结果,包含如下内容:
获取源语言和目标语言两者对应的平行语料,通过对平行语料中词汇进行编码得到字典表和对应的索引值;
分别对源语言语句和位置信息进行编码,将编码结果作为编码器神经网络输入,通过编码器神经网络获取信息编码,并利用周期函数对信息编码特征进行提取,将提取信息作为编码器神经网络最终输出;
分别对目标语言语句和位置信息进行编码,将编码结果和编码器神经网络最终输出作为解码器神经网络输入,利用周期函数对解码器神经网络输出特征进行提取,将提取的输出信息作为解码器神经网络最终输出;
将解码器神经网络最终输出经过特征映射获取字典表中索引编号,最终输出为索引编号对应词汇。
作为本发明基于周期函数的机器翻译输出修正方法,进一步的,利用词汇对语句进行拆分,提取关键字并形成公共编码表;依据公共编码表对平行语料中的词汇进行编码。
作为本发明基于周期函数的机器翻译输出修正方法,进一步地,关键字至少包含:公共词、词根和前后缀。
作为本发明基于周期函数的机器翻译输出修正方法,进一步地,源语言语句编码结果表示为:其中,X为输入的源语言语句,为源语句词嵌入编码的表示,We和Be分别为计算词嵌入编码的权重矩阵和偏差表示。
作为本发明基于周期函数的机器翻译输出修正方法,进一步地,源语言位置信息编码结果表示为:其中,X为输入的源语言语句,为源语言语句位置信息编码的表示,和分别为计算源语句的位置信息编码的权重矩阵和偏差表示。
作为本发明基于周期函数的机器翻译输出修正方法,进一步地,编码器神经网络采用多层编码器网络结构,该多层编码器网络结构输出表示为:其中,Eencoder为词嵌入编码的表示,Wencoder和Bencoder分别为计算编码器神经网络的权重矩阵和偏差表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院,未经中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011550194.4/2.html,转载请声明来源钻瓜专利网。