[发明专利]原译文对齐的方法及装置在审
申请号: | 201710982723.X | 申请日: | 2017-10-20 |
公开(公告)号: | CN107766339A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 房立夫 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 北京康盛知识产权代理有限公司11331 | 代理人: | 李晓芳 |
地址: | 430000 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 译文 对齐 方法 装置 | ||
1.一种原译文对齐的方法,其特征在于,包括:
生成原文句子标识和译文句子标识的二维表格;
确定每句原文句子和每句译文句子之间的句子匹配率,并填入所述二维表格中的对应位置上;
根据至少一个设定匹配率,对所述二维表格进行逐次扫描,在所述二维表格的每一行以及每一列中,最多确定一个与所述设定匹配率匹配的第一句子匹配率;
根据确定出的所述第一句子匹配率,将对应的原文句子和译文句子对齐。
2.如权利要求1所述的方法,其特征在于,所述确定每句原文句子和每句译文句子之间的句子匹配率包括:
确定当前原文句子和当前译文句子之间的长度匹配率;
确定当前原文句子和当前译文句子之间的提取元素匹配率,其中,所述提取元素匹配率包括:标点匹配率、非译元素匹配率、以及单词匹配率中的至少一个;
根据所述长度匹配率以及所述匹配率,确定所述当前原文句子和所述当前译文句子之间的句子匹配率。
3.如权利要求1所述的方法,其特征在于,所述在所述二维表格中每一行以及每一列中,最多确定一个与所述设定匹配率匹配的第一句子匹配率包括:
扫描所述二维表格,查找与当前设定匹配率相等的第一句子匹配率;
将查找到的每个第一句子匹配率所在行和/或所在列的其他句子匹配率设置为零;
将所述当前设定匹配率减去设定值后更新为所述当前设定匹配率;
根据所述当前设定匹配率,对所述二维表格继续进行扫描,直至所述二维表格除去所述第一句子匹配率以外的其他句子匹配率都为零。
4.如权利要求3所述的方法,其特征在于,所述将查找到的每个第一句子匹配率所在行和/或所在列的其他句子匹配率设置为零包括:
当查找到的所述第一句子匹配率不在相同的行和列时,将每个第一句子匹配率所在行以及所在列的其他句子匹配率设置为零;
当所述第一句子匹配率在相同的行或列时,将所述相同的行或列中的其他句子匹配率设置为零。
5.如权利要求1所述的方法,其特征在于,所述根据确定出的所述第一句子匹配率,将对应的原文句子和译文句子对齐包括:
将大于第一设定匹配率的所述第一句子匹配率确定为待对齐句子匹配率;
确定所述待对齐句子匹配率所在位置对应的待对齐原文句子标识和待对齐译文句子标识;
根据所述待对齐原文句子标识和所述待对齐译文句子标识,将对应的原文句子和译文句子对齐。
6.一种原译文对齐的装置,其特征在于,包括:
生成单元,用于生成原文句子标识和译文句子标识的二维表格;
匹配率填入单元,用于确定每句原文句子和每句译文句子之间的句子匹配率,并填入所述二维表格中的对应位置上;
扫描确定单元,用于根据至少一个设定匹配率,对所述二维表格进行逐次扫描,在所述二维表格的每一行以及每一列中,最多确定一个与所述设定匹配率匹配的第一句子匹配率;
对齐单元,用于根据确定出的所述第一句子匹配率,将对应的原文句子和译文句子对齐。
7.如权利要求6所述的装置,其特征在于,
所述匹配率填入单元,具体用于确定当前原文句子和当前译文句子之间的长度匹配率,确定当前原文句子和当前译文句子之间的提取元素匹配率,其中,所述提取元素匹配率包括:标点匹配率、非译元素匹配率、以及单词匹配率中的至少一个,根据所述长度匹配率以及所述匹配率,确定所述当前原文句子和所述当前译文句子之间的句子匹配率。
8.如权利要求6所述的装置,其特征在于,
所述扫描确定单元,具体用于扫描所述二维表格,查找与当前设定匹配率相等的第一句子匹配率,将查找到的每个第一句子匹配率所在行和/或所在列的其他句子匹配率设置为零,将所述当前设定匹配率减去设定值后更新为所述当前设定匹配率,根据所述当前设定匹配率,对所述二维表格继续进行扫描,直至所述二维表格除去所述第一句子匹配率以外的其他句子匹配率都为零。
9.如权利要求8所述的装置,其特征在于,
所述扫描确定单元,还用于当查找到的所述第一句子匹配率不在相同的行和列时,将每个第一句子匹配率所在行以及所在列的其他句子匹配率设置为零;当所述第一句子匹配率在相同的行或列时,将所述相同的行或列中的其他句子匹配率设置为零。
10.如权利要求7或9所述的装置,其特征在于,
所述对齐单元,具体用于将大于第一设定匹配率的所述第一句子匹配率确定为待对齐句子匹配率;确定所述待对齐句子匹配率所在位置对应的待对齐原文句子标识和待对齐译文句子标识;根据所述待对齐原文句子标识和所述待对齐译文句子标识,将对应的原文句子和译文句子对齐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710982723.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生姜的制作方法
- 下一篇:一种有助于改善视力的蓝莓果酱