[发明专利]基于上下文语义比对的人机协同翻译系统与方法有效

专利信息
申请号: 202010505909.8 申请日: 2020-06-09
公开(公告)号: CN111680523B 公开(公告)日: 2023-06-02
发明(设计)人: 夏菲 申请(专利权)人: 语联网(武汉)信息技术有限公司
主分类号: G06F40/58 分类号: G06F40/58;G06F40/211;G06F40/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 430073 湖北省武汉市武汉东湖新技术*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 上下文 语义 人机 协同 翻译 系统 方法
【说明书】:

发明提出基于上下文语义比对的人机协同翻译系统与方法。所述协同翻译系统包括待译文档输入组件、与所述待译文档输入组件通信的文档拆分识别引擎,所述文档拆分识别引擎至少包含两个输出结果识别分支,所述输出结果识别分支包括第一识别分支和第二识别分支;所述第一识别分支连接至句子上下文抽取引擎;所述第二识别分支连接至段落上下文抽取引擎,并将所述段落上下文抽取引擎的抽取结果输入至人工翻译引擎;本发明的技术方案在翻译过程中的多个阶段充分利用上下文概念以及机器翻译引擎的相互对比结果,从而提供人工翻译介入的准确时机,使得针对大规模语料翻译以及准确度要求较高的翻译场合既能保证翻译效率,同时确保翻译的准确性。

技术领域

本发明属于人机协同技术领域,尤其涉及一种基于多机器引擎上下文比对结果的协同翻译系统、基于上下文语义对比的人机协同翻译方法以及实现所述方法的计算机可读存储介质。

背景技术

机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。机译系统可划分为基于规则(Rule-Based)和基于语料库(Corpus-Based)两大类。前者由词典和规则库构成知识源;后者由经过划分并具有标注的语料库构成知识源,既不需要词典也不需要规则,以统计规律为主。机译系统是随着语料库语言学的兴起而发展起来的,世界上绝大多数机译系统都采用以规则为基础的策略,一般分为语法型、语义型、知识型和智能型。不同类型的机译系统由不同的成分构成。抽象地说,所有机译系统的处理过程都包括以下步骤:对源语言的分析或理解,在语言的某一平面进行转换,按目标语言结构规则生成目标语言。

随着全球化和信息化的不断推进,海量的翻译需求给语言服务行业带来了前所未有的机遇和挑战。将计算机辅助翻译、机器翻译集成为译员打造新的翻译工作环境已经是目前主流发展趋势。

计算机辅助翻译(Computer aided translation,CAT)类似于CAD(计算机辅助设计),能够帮助翻译者优质、高效、轻松地完成翻译工作。它不同于以往的机器翻译软件,不依赖于计算机的自动翻译,而是在人的参与下完成整个翻译过程。与人工翻译相比,质量相同或更好,翻译效率可提高一倍以上。CAT使得繁重的手工翻译流程自动化,并大幅度提高了翻译效率和翻译质量。

在翻译过程中,存在着大量重复或相似的句子和片段。采用人工笔译哪怕是最简单的句子,也需要书写一遍。CAT技术具有自动记忆和搜索机制,可以自动存储用户翻译的内容。当用户翻译某个句子时,系统自动搜索用户已经翻译过的句子,如果当前翻译的句子用户曾经翻译过,会自动给出以前的翻译结果;对于相似的句子,也会给出翻译参考和建议。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010505909.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top