[发明专利]一种辅助翻译的方法及辅助翻译系统在审
申请号: | 201810801272.X | 申请日: | 2018-07-23 |
公开(公告)号: | CN108984540A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 李靖 | 申请(专利权)人: | 传神语联网网络科技股份有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译结果 翻译系统 术语库 翻译 语句 匹配 匹配字典 时间成本 预先配置 自动查找 自动实现 自动替换 字符匹配 多模式 保证 | ||
本发明公开了一种用于辅助译员进行翻译的方法及其辅助翻译系统。利用本发明提出的技术方案,在翻译过程中,可以自动实现翻译结果中特殊术语的自动查找匹配,并且结合译员预先配置的特殊术语库,将其自动替换,从而快速的得出准确的最终翻译结果,避免了现有技术存在的低效问题。本发明使用AC自动机进行多模式串字符匹配,保证了在源语句中匹配字典中术语,特别是在术语库特别大时,匹配此语句中出现了哪些术语,整个时间成本可以下降到原来的对数级别。
技术领域
本发明属于翻译技术领域,尤其涉及一种用于辅助译员进行翻译的方法及其辅助翻译系统。
背景技术
现阶段翻译技术可以分为三种:人工翻译、计算机辅助翻译以及机器翻译。人工翻译准确度较高,但是速度较慢,并且准确度取决于译员自身的能力水平;机器翻译速度快,然而大部分机器翻译的结果并不能直接拿来使用,因为通常会存在明显的错翻以及语法错误,还是需要通过人工翻译进行进一步校正;计算机辅助翻译则是介于二者之间的一种翻译方法,其基本思路是由计算机对待译语料进行初步翻译,初步翻译结果中,待译语料中的绝大部分都能准确翻译,只有少部分特殊术语、或者由于待译语料领域特殊导致的普通术语的含义特殊化或者其他原因等导致的部分子集的翻译结果不甚准确,需要进行二次人工检查并替换为准确的术语对应翻译。
为了实现二次人工检查并将初步翻译结果中的不准确部分替换为准确术语,目前译员会根据实际情况,例如待译语料的领域、上下文特点等,事前配置一个待译语料的特殊术语库。在得到计算机的初步翻译结果后,再将其中的不准确部分查找出来进行替换。
现有技术中,这个过程是非常低效率的,主要体现在:
首先,由于不同翻译引擎对于同一个术语的(不准确)翻译结果可能表现不同,甚至同一个翻译引擎对于同一个术语的(不准确)翻译结果在不同上下文中也可能表现不同,查找这部分不准确部分变得困难,无法进行自动查找而只能手动查找,再实现手动替换;
其次,译员预先配置的特殊术语库并没有发生实际作用。现有的翻译引擎并没有对接该术语库的功能。即使某些翻译工具可以自定义某些术语的特殊翻译结果以供参考,但是该过程仍然是手动的一一输入配置,对于大规模语料翻译,这种手动操作显然是不可行的。
因此,目前的计算机辅助翻译技术存在一定的问题。
发明内容
为解决现有技术中计算机辅助翻译过程存在的效率低下的问题,本发明提出了一种辅助翻译的方法以及对应的计算机辅助翻译系统。利用本发明提出的技术方案,在翻译过程中,可以自动实现翻译结果中特殊术语的自动查找匹配,并且结合译员预先配置的特殊术语库,将其自动替换,从而快速的得出准确的最终翻译结果,避免了背景技术部分现有技术存在的低效问题。
在本发明的第一个方面,提供了一种辅助翻译的方法,该方法主要包括如下步骤:
1)将特殊术语库的术语加载进AC自动机,形成高效率的多模式字符串匹配机;
2) 使用AC自动机匹配,将匹配上的源术语替换成特殊标记(无法被翻译阵列识别);
3) 将替换后的待翻译语料进入翻译阵列,翻译阵列返回带特殊标记的翻译过的语料;
4) 再次使用术语库,将特殊标记替换回需要替换的目标术语。
其中,所述翻译阵列包含多个翻译引擎;所述翻译整列选择所述多个翻译引擎之一对所述待译语料进行翻译,并返回结果;当所述被选择的翻译引擎返回不及时或无法响应时,所述翻译阵列自动切换为其他翻译引擎。
所述特殊术语库包含多种语种的术语库,所述AC自动机根据待译语料的属性,自动选择对应语种的术语库并通知所述翻译阵列选择相应翻译引擎的相应语种翻译功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神语联网网络科技股份有限公司,未经传神语联网网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810801272.X/2.html,转载请声明来源钻瓜专利网。