[发明专利]机器翻译检查方法有效
| 申请号: | 201110098977.8 | 申请日: | 2011-04-20 |
| 公开(公告)号: | CN102184171A | 公开(公告)日: | 2011-09-14 |
| 发明(设计)人: | 江潮 | 申请(专利权)人: | 传神联合(北京)信息技术有限公司 |
| 主分类号: | G06F17/28 | 分类号: | G06F17/28 |
| 代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 张良 |
| 地址: | 100085 北京市海淀区青云里满庭*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 机器翻译 检查 方法 | ||
技术领域
本发明涉及一种计算机技术,具体说,涉及一种机器翻译检查方法。
背景技术
机器翻译(machine translation),又称机译(MT),是利用计算机把一种自然语言转变成另一种自然语言的过程。用以完成这一过程的软件叫做机器翻译系统。自20世纪30年代法国科学家阿尔楚尼提出机器翻译的设想以来,利用计算机在不同语种的文献之间自动实现准确、流畅的翻译,一直是科学家的追求目标。采用统计分析法设计更加智能化的翻译软件,掀起了新一轮研究开发热潮。谷歌公司的计算机翻译专家弗朗斯奥彻认为,提高计算机翻译水平的关键是,需要在软件中建立大约相当于100万本书的数据库。Systran公司总裁赛巴塔卡克斯也表示,他们在翻译专利文献等非常专业的技术文献时也采用了统计分析法,并认为目前计算机翻译界对统计分析法的热衷,在某种程度上也代表了市场需要的技术方向。与此同时,采用统计分析法和采用句子语法结构分析法设计翻译软件的两种技术线路也逐渐开始融合,依靠词组而不是单个单词统计分析方法,也能够处理语义学方面的问题。
上述机器翻译过程中,在翻译的时候直接使用了机器翻译结果,而这些结果往往是不准确的,达不到商用效果。
发明内容
本发明所解决的技术问题是提供一种机器翻译检查方法,减少了系统中各个模块之间交互访问的时间。
技术方案如下:
一种机器翻译检查方法,包括:
机器翻译检查,选择需要检查的语料,定义原文的翻译方向;
将原文保存到文本文件中,通过机器翻译模块进行翻译,所述机器翻译模块用于根据翻译方向翻译指定文本内容;
检查译文和翻译结果,根据句子中词的相似度阀值及标记设置标记达到相似度的原文内容,并输出报表。
进一步:在所述检查和标记过程中,依次比对译文和翻译结果,计算相似度阀值,根据所述相似度阀值判断译文和翻译结果是否大于相似度,如果是,根据标记设置标记原文内容。
进一步:所述相似度包括高相似度和一般相似度,当所述相似度阀值在0.8至1之间为所述高相似度,当所述相似度阀值在0.6至0.8之间为一般相似度。
进一步:在所述检查和标记过程中,判断循环是否结束,如果没有继续计算匹配率。
进一步:如果是最后一条语料表示则结束,如果不是最后一条语料则表示没有结束。
进一步:所述输出报表的内容包括序号、原文、译文、机器译文或者相似度。
进一步:所述相似度阀值的阀值区间在0-100%之间。
技术效果包括:
1、本发明采用文件翻译方式,一次提交,全部翻译,减少了系统中各个模块之间交互访问的时间,方便快速。
2、设定各自的权重比例,综合计算句子的相似度,根据相似度标记颜色,然后通过报表输出,表现更直观。
3、本发明翻译准确,缩短了翻译时间。
附图说明
图1是本发明中机器翻译检查方法的流程图;
图2是本发明中检查和标记过程的流程图。
具体实施方式
本发明对原译文和机器译文进行分词,根据词的相似度以及词之间的对应位置,生成一个二维矩阵,实现标记原文。下面参考附图和优选实施例,对本发明技术方案作详细描述。
如图1所示,是本发明中机器翻译检查方法的流程图。下面对机器翻译检查方法作详细描述。通过机器翻译引擎对语料原文进行翻译,然后将机器译文和语料译文进行比对。
步骤101:机器翻译检查;
步骤102:选择需要检查的语料,然后选择翻译引擎,定义原文的翻译方向;
步骤103:机器翻译。
将原文保存到文本文件中,通过机器翻译模块进行翻译,机器翻译模块的作用是根据翻译方向翻译指定文本内容。
本发明采用文件翻译方式,一次提交,全部翻译方式来处理。将原文保存到文本文件中,每句一行,参考代码如下:
将文本文件提交到后台翻译,参考代码如下:
步骤104:检查,依次比对译文和翻译结果;
步骤105:标记,根据句子中词的相似度阀值(阀值区间在0-100%之间)及标记设置,标记达到相似度(高相似度:1>阀值>80%,一般相似度:80%>阀值>60%)的原文内容,标记可以选用颜色方式(在报表中体现,不在原语料中标记)。
步骤106:输出报表(内容包括:序号、原文、译文、机器译文、相似度等)。
标记颜色,输出报表,参考代码如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神联合(北京)信息技术有限公司,未经传神联合(北京)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110098977.8/2.html,转载请声明来源钻瓜专利网。





