[发明专利]一种翻译质量的确定方法及装置在审
| 申请号: | 201811384436.X | 申请日: | 2018-11-20 |
| 公开(公告)号: | CN109858042A | 公开(公告)日: | 2019-06-07 |
| 发明(设计)人: | 张为泰;刘俊华;魏思;王智国 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜;王宝筠 |
| 地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标文本 文本特征 翻译 源文本 文本 获取目标 自动评价 申请 译文 参考 保证 | ||
本申请公开了一种翻译质量的确定方法及装置,该方法包括:获取目标文本,该目标文本是对源文本进行翻译后的文本,然后,生成各个文本特征,每一文本特征是根据源文本和/或目标文本生成的与翻译质量相关的特征,最后根据生成的各个文本特征,确定目标文本的翻译质量。可见,本申请根据目标文本对应的各个文本特征来评价其翻译质量,可以保证评价结果的准确性,此外,与现有技术中利用参考译文进行自动评价或直接进行人工评价的方式,节省了大量人力。
技术领域
本申请涉及机器翻译技术领域,尤其涉及一种翻译质量的确定方法及装置。
背景技术
机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。经历了数十年的发展与进步,机器翻译从基于规则的方法到基于统计的方法,再到当前基于神经网络的方法,机器翻译能力得到极大的提升,在忠实度和流利度等方面,基本达到了日常交流可用的水平。
现有的机器翻译结果评价方法一般分为自动评价和人工评价两种方法,其中,自动评价方法需要参考译文,由确定的计算公式和方法进行翻译质量的自动评价,人工评价方法需要专家对机器翻译结果在流利度和准确度上面分别进行人工打分。
可见,自动评价方法需要每个翻译结果都有对应的参考译文,这需要人工收集参考译文,在实际应用中将耗费大量人力。而人工评价方法要求专家对每个机器翻译结果做出评价,将增加专家的工作量,无法提升专家的工作效率,在实际应用中也将耗费大量人力。
发明内容
本申请实施例的主要目的在于提供一种翻译质量的确定方法及装置,不但能够准确的评价翻译结果的翻译质量,还节省了人力。
本申请实施例提供了一种翻译质量的确定方法,包括:
获取目标文本,所述目标文本是对源文本进行翻译后的文本;
生成各个文本特征,所述文本特征是根据所述源文本和/或所述目标文本生成的与翻译质量相关的特征;
根据生成的各个文本特征,确定所述目标文本的翻译质量。
可选的,所述生成各个文本特征,包括:
生成第一文本特征、第二文本特征、第三文本特征、第四文本特征、第五文本特征、第六文本特征中的至少一个特征;
其中,所述第一文本特征表征了所述源文本的各个词语的翻译难度;所述第二文本特征表征了所述源文本的句式结构的复杂程度;所述第三文本特征表征了所述源文本的文本长度;所述第四文本特征表征了所述源文本所属领域的文本翻译难度;第五文本特征表征了所述目标文本的反向翻译结果的翻译质量;所述第六文本特征表征了所述目标文本的语言风格与人工翻译风格之间的差异程度。
可选的,所述生成第一文本特征,包括:
根据所述源文本中的各个词语在预先构建的样本文本集中出现的词频和/或所述源文本中的各个词语的难度等级,生成第一文本特征。
可选的,所述生成第二文本特征,包括:
根据所述源文本的句法分析树和/或语义依存树,生成第二文本特征。
可选的,所述根据所述源文本的句法分析树和/或语义依存树,生成第二文本特征,包括:
提取所述源文本的句法分析树的深度信息、广度信息和节点信息中的至少一个信息,和/或,提取所述源文本的语义依存树的深度信息、广度信息和节点信息中的至少一个信息;
根据提取的信息,生成第二文本特征。
可选的,所述生成第五文本特征,包括:
对所述目标文本进行反向翻译,得到反向翻译文本,所述反向翻译文本与所述源文本的语种相同;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811384436.X/2.html,转载请声明来源钻瓜专利网。





