[发明专利]基于逆向矩阵分析的人机反馈翻译方法与系统有效
申请号: | 202010505910.0 | 申请日: | 2020-06-09 |
公开(公告)号: | CN111680524B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 何征宇 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/44 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市武汉东湖新技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 逆向 矩阵 分析 人机 反馈 翻译 方法 系统 | ||
本发明提出一种基于逆向矩阵分析的人机反馈翻译方法、一种具备反馈调节的人机共译系统以及实现所述方法的计算机可读存储介质。所述方法包括接收待译文档、对所述待译文档进行语义识别以及利用组合机器翻译工具对其进行翻译后生成相似度矩阵以及差异度矩阵从而选择逆向翻译引擎比对差异进行人机共译的过程。采用本发明的技术方案可提供人工翻译介入的准确时机,使得针对大规模语料翻译以及准确度要求较高的翻译场合既能保证翻译效率,同时确保翻译的准确性,从而实现在保证准确度的同时能够满足大规模语义翻译的需要。
技术领域
本发明属于翻译技术领域,尤其涉及一种基于逆向矩阵分析的人机反馈翻译方法、一种具备反馈调节的人机共译系统以及实现所述方法的计算机可读存储介质。
背景技术
机器翻译其实是利用计算机把一种自然语言翻译成另一种自然语言的过程,基本流程大概分为三块:预处理、核心翻译、后处理。预处理是对语言文字进行规整,把过长的句子通过标点符号分成几个短句子,过滤一些语气词和与意思无关的文字,将一些数字和表达不规范的地方,归整成符合规范的句子。核心翻译模块是将输入的字符单元、序列翻译成目标语言序列的过程,这是机器翻译中最关键最核心的地方。后处理模块是将翻译结果进行大小写的转化、建模单元进行拼接,特殊符号进行处理,使得翻译结果更加符合人们的阅读习惯。
实现高质量机器翻译的梦想已经存在了很多年,很多科学家都为这一梦想贡献了自己的时间和心力。从早期的基于规则的机器翻译到如今广泛应用的神经机器翻译,机器翻译的水平不断提升,已经能满足很多场景的基本应用需求。
在大规模的翻译工程时代,机器翻译工具的使用不可避免。然而,机器翻译的局限性导致其不可能完全替代人工翻译。尽管如此,如果选择了正确的翻译工具,翻译效率将大大提高,这是不可否认的。
现有技术已经存在各种不同语言之间的翻译工具与机器翻译引擎,包括各种伴随人工智能、大数据、深度学习技术发展起来的优化的机器翻译方案。
目前最重要的两种机器翻译方式:规则法和统计法。规则法(rule based machinetranslation,RBMT),依据语言规则对文本进行分析,再借助计算机程序进行翻译。多数商用机器翻译系统采用规则法。统计法(statistical machine translation,SMT),通过对大量的平行语料进行统计分析,构建统计翻译模型(词汇、比对或是语言模式),进而使用此模型进行翻译,一般会选取统计中出现概率最高的词条作为翻译,概率算法依据贝叶斯定理。假设要把一个英语句子A翻译成汉语,所有汉语句子B,都是A的可能或是非可能的潜在翻译。Pr(A)是类似A表达出现的概率,Pr(B|A)是A翻译成B出现的概率。找到两个参数的最大值,就能缩小句子及其对应翻译检索的范围,从而找出最合适的翻译。SMT根据文本分析程度级别的不同分为两种:基于词的SMT和基于短语的SMT,后一个是目前普遍使用的,Google用的就是这种。翻译文本被自动分为固定长度的词语序列,再对各词语序列在语料库里进行统计分析,以查找到出现对应概率最高的翻译。
申请号为CN201910772953.2的中国发明专利申请提出一种基于句对的机器翻译引擎测评优选方法及系统,其通过根据选择的语言对、句的领域,对各机器翻译引擎进行多个维度的评分,再对上述评分进行加权求和得到各机器翻译引擎在句上的加权和值,选择加权和值最高的机器翻译引擎输出句的翻译结果,从而整合得到整篇翻译文本。通过上述方法可以使得在众多复杂的、翻译质量参差不齐、擅长领域和语言对各有不同的各类机器翻译引擎中为用户提供机器翻译引擎自动优选服务,能够让用户在翻译文件等长文本时每句话都得到目前最优秀的机器翻译引擎服务,提高翻译效率,减少用户的后续工作量,提供优质的机器翻译服务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010505910.0/2.html,转载请声明来源钻瓜专利网。