[发明专利]一种翻译方法在审
| 申请号: | 201910916756.3 | 申请日: | 2019-09-26 |
| 公开(公告)号: | CN110705319A | 公开(公告)日: | 2020-01-17 |
| 发明(设计)人: | 张广睿 | 申请(专利权)人: | 张广睿;四川钻文科技有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58 |
| 代理公司: | 51211 成都天嘉专利事务所(普通合伙) | 代理人: | 邓小兵 |
| 地址: | 610000 四川省*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种翻译方法,主要翻译工序为:精简待译文档内容——翻译——还原回填,最主要的是进行了二次去除非译文字处理(包括去除待译文字集合中的非译文字和去除使用编号替换后混合集合中的非译文字)和三次去除重复内容处理(包括去除待译文字集合中的重复内容、去除名词性术语中的重复内容和混合集合中重复的内容),通过这样的处理,能将复杂的待译文字集合简化到极致,即能将待译文字集合中的内容简化成最基本的语架。再通过与已知数据库比对,即能够非常准确地得出短句译文。最后采用还原、回填等方式即可得出非常准确的译文。本发明能在尽量保留译文上下文逻辑顺序的前提下,统一术语,统一句式,达到提高翻译准确性的目的。 | ||
| 搜索关键词: | 去除 文字集合 重复内容 译文 翻译 回填 还原 集合 短句 上下文逻辑 待译文档 文字处理 已知数据 名词性 比对 替换 统一 重复 保留 | ||
【主权项】:
1.一种翻译方法,其特征在于包括以下步骤:/n(1)提取待译文档中的文字信息,并统一文字信息的格式,然后将其拆分成以单词、词组和单句为最小单位组成的待译文字集合,再去除待译文字集合中的非译文字和重复内容;/n(2)建立译前处理文档,并在该译前处理文档中设置原文列和译文列,然后将经步骤(1)处理后的待译文字集合中的内容按前后逻辑顺序复制到原文列中;/n(3)依照名词性术语在经步骤(1)处理后的待译文字集合中出现的前后逻辑顺序,提取待译文字集合中全部的名词性术语,得到具有前后逻辑顺序的名词性术语集合,再对名词性术语集合进行去重处理,得到无重复的、且包含前后逻辑顺序的已去重名词性术语集合;/n(4)建立逻辑名词性术语表,并在该逻辑名词性术语表中设置编号列、术语原文列和术语译文列,将已去重名词性术语集合中的名词性术语按前后逻辑顺序复制到术语原文列中;在编号列中采用编号依次对术语原文列中的名词性术语进行编号;并与已知词典比对得出与术语原文列中名词性术语相对应的术语译文,将得出的术语译文对应复制到术语译文列中,得到编号、术语原文和术语译文一一对应的逻辑名词性术语表;/n(5)将逻辑名词性术语表术语原文列中与名词性术语相对应的编号代入经步骤(1)处理后的待译文字集合中,替换待译文字集合中全部的名词性术语,得到由编号、单词、不带编号的词组、不带编号的单句、带编号的词组语架和带编号的单句语架所组成的混合集合;/n(6)先去除混合集合中单独的编号,再通过比对去除混合集合中相重复的内容,得到由单词、不带编号的词组、不带编号的单句、带编号的词组语架和带编号的单句语架组成的深度处理待译文字集合;/n(7)将深度处理待译文字集合与已知数据库进行比对,得到由单词译文、不带编号的词组译文、不带编号的单句译文、带编号的词组语架译文和带编号的单句语架译文组成的深度处理译文集合;/n(8)将深度处理译文集合还原至步骤(5)的混合集合中,得到由编号、单词译文、不带编号的词组译文、不带编号的单句译文、带编号的词组语架译文和带编号的单句语架译文所组成的混合集合译文;/n(9)使用逻辑名词性术语表中与编号相对应的名词性术语的译文替换混合集合译文中全部的编号,替换后得到待译文字集合译文;/n(10)先将待译文字集合译文对应复制到译前处理文档的译文列中,得到译后处理文档;/n(11)根据译后处理文档得出与待译文档格式相同的译文。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张广睿;四川钻文科技有限公司,未经张广睿;四川钻文科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910916756.3/,转载请声明来源钻瓜专利网。





