[发明专利]一种在线翻译引擎的推送方法有效
申请号: | 201410298485.7 | 申请日: | 2014-06-26 |
公开(公告)号: | CN104090870B | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 江潮;贺建华;张光凌 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京康盛知识产权代理有限公司11331 | 代理人: | 张宇峰 |
地址: | 430070 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 在线翻译 引擎 推送 方法 | ||
1.一种在线翻译引擎的推送方法,其特征在于,包括:
获取用户提供的待译文本;
检测出所述待译文本的归属领域;
对每个归属领域分别进行如下处理:
调取归属领域下的参考原文以及参考译文;
对所述参考原文进行分词处理,获取其中的所有术语;
将获得的所有术语分别推送给每个翻译引擎进行翻译,并分别记录翻译结果;
将每个翻译结果与所述参考译文进行术语匹配,并计算每个翻译结果匹配成功的术语在所有术语中的占比;
建立所述占比大于阈值的翻译结果所使用的翻译引擎与该归属领域的关联关系;
根据每个归属领域,以及所述关联关系,构建所述领域映射表;
根据检测出的所述归属领域在领域映射表中找到对应的至少一个翻译引擎推送给用户。
2.根据权利要求1所述的推送方法,其特征在于,检测所述待译文本的归属领域的过程,包括:
对所述待译文本进行分词处理,获得所述待译文本中的所有术语;
确定每个所述术语的归属领域;
计算出每个归属领域中术语在所有术语中的占比;
将所述占比最大的归属领域作为所述待译文本的归属领域。
3.根据权利要求1所述的推送方法,其特征在于,根据检测出的所述归属领域在领域映射表中找到对应的多个翻译引擎时,还包括:
在所述多个翻译引擎中选取翻译分值最高的翻译引擎推送给用户。
4.根据权利要求3所述的推送方法,其特征在于,每个所述翻译引擎的翻译分值的计算过程,包括:
调取参考原文以及参考译文;
将所述参考原文推送给翻译引擎进行翻译,记录翻译结果;
根据所述翻译结果和所述参考译文至少计算出如下之一的分值:原文忠实度分值、术语规范度分值、信息完整度分值和行文通顺度分值;
其总和为该翻译引擎的翻译分值。
5.根据权利要求4所述的推送方法,其特征在于,计算所述原文忠实度分值的过程,包括:
对所述参考原文进行分词处理,获取其中的词汇;所述词汇至少包含以下之一:一元词、多元词和常用句子;
将所述词汇推送给翻译引擎进行翻译,记录翻译结果;
将所述翻译结果与所述参考译文进行匹配,记录匹配成功的词汇;
计算匹配成功的词汇在所有词汇中的占比;
将得到的所述占比乘以原文忠实度权重系数,获得所述原文忠实度分值。
6.根据权利要求4所述的推送方法,其特征在于,计算所述术语规范度分值的过程,包括:
对所述参考原文进行分词处理,获取所有术语;
将所述所有术语推送给翻译引擎进行翻译,记录翻译结果;
将所述翻译结果与所述参考译文进行匹配,记录匹配成功的术语;
计算匹配成功的术语在所有词汇中的占比;
将得到的所述占比乘以术语规范度权重系数,获得所述术语规范度分值。
7.根据权利要求4所述的推送方法,其特征在于,计算所述信息完整度分值的过程,包括:
确定所述参考原文中的所有语句;
将所有语句推送给翻译引擎进行翻译,记录翻译结果;
将所述翻译结果与素数参考译文进行匹配,记录匹配成功的语句;
计算匹配成功的语句在所有语句中的占比;
将得到的所述占比乘以信息完整度权重系数,获得所述信息完整度分值。
8.根据权利要求4所述的推送方法,其特征在于,计算所述行文通顺度分值的过程,包括:
将参考原文推送给翻译引擎进行翻译,记录翻译结果;
将翻译结果与所述参考译文进行匹配,统计所述翻译结果与参考译文之间差异的字或词;
计算所述差异的字或词在所述参考原文中的占比;
将得到的所述占比乘以行文通顺度权重系数,获得所述行文通顺度分值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410298485.7/1.html,转载请声明来源钻瓜专利网。