[发明专利]一种基于GMM的机翻引擎测试方法与翻译工具包有效
申请号: | 201911161479.6 | 申请日: | 2019-11-27 |
公开(公告)号: | CN111046676B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 何征宇;夏菲 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F40/42 | 分类号: | G06F40/42;G06F40/51 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市武汉东湖新技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gmm 引擎 测试 方法 翻译 工具包 | ||
本发明提出一种基于GMM的机翻引擎测试方法与翻译工具包。所述测试方法使用基于Openkiwi的评测引擎;所述评测引擎包括基于句子级别的评测引擎和基于词语级别的评测引擎;基于句子级别评分数值以及词语级别评分数值,构建评测矩阵PN,基于所述评测矩阵PN的迭代计算结果,判断是否通过人工反馈输入接口输入人工反馈参数。本发明还提出一种包含评测引擎的翻译工具包,所述翻译工具包包含至少一个翻译工具,并内置所述的基于Openkiwi的评测引擎,从而实现所述测试方法。
技术领域
本发明属于测试技术领域,尤其涉及一种基于GMM的机翻引擎测试方法与翻译工具包。
背景技术
机器翻译(Machine Translation,MT),又称为自动翻译,是利用计算机程序将文字从一种自然语言(源语言)翻译成另一种自然语言(目标语言)。它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(ComputationalLinguistics)、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系。
在人工智能火热的时代,当下的机器翻译引擎众多,译员应该如何选择适合自己的翻译引擎,成为一个亟待解决的技术问题;同时,已有的翻译引擎如何根据实际翻译结果以及人工反馈不断进化选择,已经成为制约翻译效率的重要因素。
机器翻译领域最困难的任务之一就是对给定的翻译系统或者翻译算法进行评价,我们称其为机器翻译评测。由于机器翻译所处理的对象——语言本身存在某种程度的歧义,无法像数学公式或者物理模型那样简单客观地描述出来,这使得为机器翻译结果进行客观的打分变得非常困难。最早的方法是人工评测,这种方法得到的结果一般是十分准确的,但评测的成本太高,周期过长(评测过程可能长达几周甚至数月),评价结果也会随着评价人的变化和时间的推移而不同,这使得评价结果不可重复,缺乏客观性。
例如,申请号为CN201611186415.8的中国发明专利申请提出的一种基于众投的译文评价方法及系统,从同一译文文档中提取所有译句;从译文文档对应的原文文档中,提取与每一译句对应的原句;将译句和原句推送给至少一个评价用户;获取至少一个评价用户对每一译句的翻译质量评价;统计所有译句的翻译质量评价,根据翻译质量评价,确定译文文档的翻译质量。然而,人工评测耗时费力,效率低下,而且由于人的主观因素,对于同一篇译文不同的评测人员可能给出不同的判断。
现有的各种翻译工具都至少内置了多种翻译引擎,例如将谷歌翻译、搜狗翻译、有道翻译、百度翻译等组合成一个包含对外接口的翻译引擎矩阵,实际翻译时,翻译引擎矩阵将会从中选择一个或者多个翻译引擎进行翻译,从而输出对应的翻译结果。评价的目的通常是对于给定的待译文档选择最合适的翻译引擎。现有技术对于翻译引擎的自动评测通常都是直接进行,其评测过程虽然是自动化进行,但是评测结果很大程度上取决于自动评测过程所采用的的标准和算法,而这些标准和算法大部分都是通过先验规则阈值的,事实上使得评测结果带有较强的主观性,导致选择结果准确度不高,客观性存疑。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911161479.6/2.html,转载请声明来源钻瓜专利网。