[发明专利]原译文对齐的方法及装置在审
申请号: | 201710982723.X | 申请日: | 2017-10-20 |
公开(公告)号: | CN107766339A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 房立夫 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 北京康盛知识产权代理有限公司11331 | 代理人: | 李晓芳 |
地址: | 430000 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 译文 对齐 方法 装置 | ||
技术领域
本发明涉及翻译技术领域,特别涉及原译文对齐的方法及装置。
背景技术
当前计算机辅助翻译是提高翻译一致性和效率的重要手段,它能够帮助翻译者优质、高效、轻松地完成翻译,使得繁重的手工翻译流程自动化,并大幅度提高了翻译效率和翻译质量。通过计算机辅助翻译对原文文件进行翻译,形成译文文件后,翻译人员可能需要获取译文文件中与原文文件中设定原文句子对应的译文句子,或者,需要获取原文文件中与设定译文句子对应的原文句子,即需要原文句子和译文句子对齐,从而,可进行后续的校对、编辑等。
而目前,可通过翻译人员通过将原文文件和译文文件进行对照查看,进行原文和译文的对齐,效率比较低下。
发明内容
本发明实施例提供了一种原译文对齐的方法及装置。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
根据本发明实施例的第一方面,提供了一种原译文对齐的方法,包括:
生成原文句子标识和译文句子标识的二维表格;
确定每句原文句子和每句译文句子之间的句子匹配率,并填入所述二维表格中的对应位置上;
根据至少一个设定匹配率,对所述二维表格进行逐次扫描,在所述二维表格的每一行以及每一列中,最多确定一个与所述设定匹配率匹配的第一句子匹配率;
根据确定出的所述第一句子匹配率,将对应的原文句子和译文句子对齐。
本发明一实施例中,所述确定每句原文句子和每句译文句子之间的句子匹配率包括:
确定当前原文句子和当前译文句子之间的长度匹配率;
确定当前原文句子和当前译文句子之间的提取元素匹配率,其中,所述提取元素匹配率包括:标点匹配率、非译元素匹配率、以及单词匹配率中的至少一个;
根据所述长度匹配率以及所述匹配率,确定所述当前原文句子和所述当前译文句子之间的句子匹配率。
本发明一实施例中,所述在所述二维表格中每一行以及每一列中,最多确定一个与所述设定匹配率匹配的第一句子匹配率包括:
扫描所述二维表格,查找与当前设定匹配率相等的第一句子匹配率;
将查找到的每个第一句子匹配率所在行和/或所在列的其他句子匹配率设置为零;
将所述当前设定匹配率减去设定值后更新为所述当前设定匹配率;
根据所述当前设定匹配率,对所述二维表格继续进行扫描,直至所述二维表格除去所述第一句子匹配率以外的其他句子匹配率都为零。
本发明一实施例中,所述将查找到的每个第一句子匹配率所在行和/或所在列的其他句子匹配率设置为零包括:
当查找到的所述第一句子匹配率不在相同的行和列时,将每个第一句子匹配率所在行以及所在列的其他句子匹配率设置为零;
当所述第一句子匹配率在相同的行或列时,将所述相同的行或列中的其他句子匹配率设置为零。
本发明一实施例中,所述根据确定出的所述第一句子匹配率,将对应的原文句子和译文句子对齐包括:
将大于第一设定匹配率的所述第一句子匹配率确定为待对齐句子匹配率;
确定所述待对齐句子匹配率所在位置对应的待对齐原文句子标识和待对齐译文句子标识;
根据所述待对齐原文句子标识和所述待对齐译文句子标识,将对应的原文句子和译文句子对齐。
根据本发明实施例的第二方面,提供一种原译文对齐的装置,包括:
生成单元,用于生成原文句子标识和译文句子标识的二维表格;
匹配率填入单元,用于确定每句原文句子和每句译文句子之间的句子匹配率,并填入所述二维表格中的对应位置上;
扫描确定单元,用于根据至少一个设定匹配率,对所述二维表格进行逐次扫描,在所述二维表格的每一行以及每一列中,最多确定一个与所述设定匹配率匹配的第一句子匹配率;
对齐单元,用于根据确定出的所述第一句子匹配率,将对应的原文句子和译文句子对齐。
本发明一实施例中,所述匹配率填入单元,具体用于确定当前原文句子和当前译文句子之间的长度匹配率,确定当前原文句子和当前译文句子之间的提取元素匹配率,其中,所述提取元素匹配率包括:标点匹配率、非译元素匹配率、以及单词匹配率中的至少一个,根据所述长度匹配率以及所述匹配率,确定所述当前原文句子和所述当前译文句子之间的句子匹配率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710982723.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生姜的制作方法
- 下一篇:一种有助于改善视力的蓝莓果酱