[发明专利]一致性翻译术语的预处理技术有效
| 申请号: | 201811079665.0 | 申请日: | 2018-09-19 |
| 公开(公告)号: | CN109241543B | 公开(公告)日: | 2023-05-30 |
| 发明(设计)人: | 何恩培;何征宇;郑丽华;王莲 | 申请(专利权)人: | 传神语联网网络科技股份有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 430073 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一致性 翻译 术语 预处理 技术 | ||
1.一种计算机实现的翻译一致性术语预处理系统,所述系统包括领域确定模块和一致性术语筛选模块,其特征在于:
所述领域确定模块包括随机抽取模块和语料分词模块;
所述随机抽取模块用于从待译材料的开头部分往后随机抽取第二预定比例的语料,并从待译材料的末尾部分往前随机抽取第三预定比例的语料;
所述语料分词模块用于对所述随机抽取模块抽取的语料进行基于自然语言处理的分词处理;所述领域确定模块基于所述语料分词模块的分词结果,结合预先建立的术语对照数据库,确定所述待译材料的领域,从而确定至少一个领域术语对照数据库;
所述一致性术语筛选模块包括语料转换模块、分类模块和标准确定模块;
所述语料转换模块将所述待译材料转换为待译词语库;
分类模块用于将待译词语库的词语进行分类,并输出分类结果;
标准确定模块,用于确定不同分类词的筛选标准;
所述一致性术语筛选模块基于所述筛选标准,筛选出一致性翻译术语;
所述一致性术语为各个翻译人员/翻译团队应当在翻译过程中保持翻译标准一致的术语;
所述领域术语对照数据库建立模块用于建立领域术语对照数据库;所述领域术语对照数据库,为事先建立并在翻译过程中不断更新的与领域相关的特殊术语数据库;
所述特殊术语数据库按照如下方式建立:
收集超过预定数量的某个特定领域的语料文档;
对所述语料文档进行分词处理,将语料文档转换为词汇库;
对所述词汇库进行语义分析,针对每一个词汇,综合词频、分布、词性、大小写维度进行打分,如果分值满足第一条件,则将该词汇列入特殊术语数据库。
2.如权利要求1所述的一种计算机实现的翻译一致性术语预处理系统,其特征在于:
领域术语对照数据库建立模块还包括反馈与更新模块,用于接受翻译结果反馈,对所述领域术语对照数据库进行更新。
3.如权利要求1所述的一种计算机实现的翻译一致性术语预处理系统,其特征在于:
所述分类模块、标准确定模块在执行分类以及标准确定时,均基于已有的领域术语对照数据库;并且,分类结果与最终的筛选结果用于反馈与更新模块更新所述领域术语对照数据库。
4.一种一致性翻译术语的提取方法,所述一致性翻译术语为各个翻译人员/翻译团队应当在翻译过程中保持翻译标准一致的术语;
其特征在于,所述方法包括如下步骤:
从待译材料的开头部分往后随机抽取第二预定比例的语料,从待译材料的末尾部分往前随机抽取第三预定比例的语料;
对随机抽取的所述语料进行基于自然语言处理的分词处理;
基于所述分词处理的结果,确定至少一个领域术语对照数据库;
在确定至少一个领域术语对照数据库后,
还包括如下步骤:
(I)对待译材料进行分词处理,将待译材料转换为待译词语库;
(II)对所述待译词语库的每一个词语进行分类,得到不同的词语分类;
(III)基于所述领域术语对照数据库,确定不同分类的词语的对照标准;
(IV)基于所述对照标准与所述领域术语对照数据库,对所述不同分类的词语进行筛选,从而得出一致性翻译术语;所述领域术语对照数据库,为事先建立并在翻译过程中不断更新的与领域相关的特殊术语数据库;
所述特殊术语数据库按照如下方式建立:
收集超过预定数量的某个特定领域的语料文档;
对所述语料文档进行分词处理,将语料文档转换为词汇库;
对所述词汇库进行语义分析,针对每一个词汇,综合词频、分布、词性、大小写维度进行打分,如果分值满足第一条件,则将该词汇列入特殊术语数据库。
5.一种计算机可读存储介质,其上包含有计算机可执行指令,通过处理器和存储器执行所述指令,用于实现权利要求4所述的一种一致性翻译术语的提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神语联网网络科技股份有限公司,未经传神语联网网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811079665.0/1.html,转载请声明来源钻瓜专利网。





