[发明专利]一种译文检查方法及其系统有效
申请号: | 201310456548.2 | 申请日: | 2013-09-29 |
公开(公告)号: | CN104516870B | 公开(公告)日: | 2018-08-07 |
发明(设计)人: | 叶茂;王元龙;金立峰;汤帜;徐剑波 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/28 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 寇海侠 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 译文 检查 方法 及其 系统 | ||
本发明提供一种译文检查方法及其系统,包括初始化处理和检查判定处理。所述初始化处理,基于一批语料来训练二元语法模型,作为检查评分模型,为所述检查判定处理时给译文打分提供依据。所述检查判定处理,通过所述检查评分模型给译文打分,将译文得分与预设判定阈值比较,将得分小于所述预设判定阈值的译文判定为“错误”,否则判定为“正确”。上述技术方案有效避免了现有技术中对译文检测方法很大程度上依赖于双语专家或高质量的人工翻译译文作为参照,同时不能判断正确与否,只能判断评测译文的好差程度的问题。
技术领域
本发明涉及一种译文检查方法及其系统,具体是一种基于二元语法模型的译文检查方法及其系统,属于电数字数据处理方法技术领域。
背景技术
近年来,机器翻译(Machine Translation)的应用越来越广泛,而且对机器翻译译文的质量要求越来越高。在翻译领域内,即使最好的翻译人员也很难达到翻译界所要求的最高标准“信、达、雅”,因此机器翻译评价成为一个重要而困难的课题。
由于要对译文质量评价至少要懂得两种语言,译文质量评价成为一项难度很大的智力活动,因此对机器翻译的译文质量的评价通常由专家来进行,而且价格成本不菲,评价过程也非常耗时而且不可重用。
一般机器译文的评价出发点为“有多好”和“哪个更好”,如果在人工对译文评价之前,将译文中“不正确”或“错误”的译文筛选出来,将大大缩减人工评价译文的成本和时间。
在翻译需求中,有一类是针对领域短语的翻译,由于领域短语包含的文字不多且通常具备显著的领域特征,因此通过一定量的领域语料,能够从不同角度发现其规律,并建立模型。
现有技术中IBM提出的基于N元匹配的BLEU机器翻译评测方法需要不同的双语专家对原文进行翻译得到参考译文,然后计算机器译文与这多个参考译文的字符串相似度,从而实现对机器翻译译文质量的评测。该方法进行评测译文时,需要提供人工翻译的高质量译文作为参照,获取大量高质量译文的成本很高;同时在很大程度上依赖于双语专家,其成本仍然很大;另外该方法只能评测译文有“多好”,而不能判断翻译译文是否“错误”。
现有技术中还公开了一种机器翻译自纠错的方法,首先定义翻译错误类别,将翻译错误类别定义为正确、一般错误、次序错误、集外词错误、其他错误五类;训练错误分类器,对翻译错误进行分类;将翻译映射到源语言端并构建复述词图网络;最后得到词图解码并加以校正。该方法首先通过抽取与具体语言相关的字、词、词性标注、句法、语法、语义特征建立语料库,构造训练模型,需要大量语料的准备有很大的难度;其次该方法是基于动态概率潜变量模型的算法也需要大规模的语料准备数据;另外,该方法只能检查所定义的翻译错误类别,如果译文的错误类别不属于所定义的翻译错误类别,则不能判断翻译译文是否“错误”。
发明内容
本发明所要解决的技术问题是现有技术中译文检测方法在很大程度上依赖于双语专家,同时不能判断正确与否,只能判断评测译文的好差程度,从而提供一种通过学习语料,训练出二元语法模型,通过该模型自动将相关的海量译文中“不正确”或“错误”的短语译文过滤掉的译文检查方法。
为解决上述技术问题,本发明是通过以下技术方案实现的:
一种译文检查方法,包括初始化处理和检查评定处理,
所述初始化处理,基于一批语料,通过统计语料二元切分条目的概率信息,来获得二元语法模型,作为检查评分模型,为所述检查判定处理时给译文打分提供依据;
所述检查评定处理,通过所述检查评分模型给译文打分,将译文得分与预设判定阈值比较,将得分小于所述预设判定阈值的译文判定为“错误”,否则判定为“正确”。
所述初始化处理的步骤如下:
获取文本集D,d∈D,其中d表示所述文本集D的一个文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学,未经北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310456548.2/2.html,转载请声明来源钻瓜专利网。