[发明专利]一种基于GMM的机翻引擎测试方法与翻译工具包有效
申请号: | 201911161479.6 | 申请日: | 2019-11-27 |
公开(公告)号: | CN111046676B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 何征宇;夏菲 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F40/42 | 分类号: | G06F40/42;G06F40/51 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市武汉东湖新技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gmm 引擎 测试 方法 翻译 工具包 | ||
1.一种基于高斯混合模型GMM的机翻引擎测试方法,所述方法包括如下步骤:
C100:输入测试源文档;
C200:采用GMM聚类模型对所述测试源文档进行聚类分类,并输出测试源文档所在类别;C300:基于所述测试源文档所在类别以及类别到最佳引擎映射表进行映射计算,从翻译矩阵中得出所在类别对应的翻译引擎;
C400:输出所有翻译引擎对应的翻译结果;
其特征在于,在所述步骤C400之后,还包括如下步骤:
C500:将所述翻译结果输入自动评测模型,得出质量评测得分;
并且,基于所述质量评测得分,对基础数据进行更新后,反馈给所述聚类模型;
其中,所述自动评测模型还连接人工反馈输入接口;
所述自动评测模型是基于Openkiwi的评测引擎;所述评测引擎包括基于句子级别的评测引擎和基于词语级别的评测引擎;
所述类别到最佳引擎映射表,是将某个类别的最佳翻译引擎,或者最后几个翻译引擎的排序进行映射的表;
所述翻译矩阵将多个翻译引擎集中整合到一起,形成一个统一对外的调用产品。
2.如权利要求1所述的测试方法,其特征在于,Openkiwi是以pytorch为基础开发的一个深度翻译质量评测框架。
3.如权利要求1所述的测试方法,其特征在于,输出测试源文档所在类别,包括,输出所述测试源文档聚类后的多个类别;所述从翻译矩阵中得出所在类别对应的翻译引擎,包括,得出每一个类别对应的多个翻译引擎。
4.如权利要求1所述的测试方法,其特征在于,将所述翻译结果输入自动评测模型,得出质量评测得分,具体包括:
基于所述测试源文档的多个类别,从翻译矩阵中选择对应的多个翻译引擎,对所述测试源文档进行翻译,并输出多个翻译结果,所述翻译结果包括每一种类别Ji对应的N个翻译引擎的翻译结果TRi1,TRi2,……TRiN;i=1,……,N;
采用所述基于Openkiwi的评测引擎的基于句子级别的评测引擎对所述多个翻译结果进行评测,得到得到每一种类别Ji对应的N个翻译引擎的翻译结果TRi1,TRi2,……TRiN的句子级别评分数值SFi1,SFi2,……SFiN;
采用所述基于Openkiwi的评测引擎的基于词语级别的评测引擎对所述多个翻译结果进行评测,得到得到每一种类别Ji对应的N个翻译引擎的翻译结果TRi1,TRi2,……TRiN的词语级别评分数值CFi1,CFi2,……CFiN。
5.如权利要求4所述的测试方法,其特征在于,基于所述句子级别评分数值以及词语级别评分数值,构建评测矩阵PN,基于所述评测矩阵PN的迭代计算结果,判断是否通过所述人工反馈输入接口输入人工反馈参数。
6.一种计算机可读存储介质,其上存储有计算机可执行指令,通过存储器和处理器执行所述可执行指令,用于实现权利要求1-5任一项所述的一种基于高斯混合模型GMM的机翻引擎测试方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911161479.6/1.html,转载请声明来源钻瓜专利网。