[发明专利]校正术语对的自动定位方法、装置、电子设备及存储介质有效
| 申请号: | 202011305060.6 | 申请日: | 2020-11-20 |
| 公开(公告)号: | CN112215018B | 公开(公告)日: | 2021-08-13 |
| 发明(设计)人: | 周玉;邓彪;李小青;刘鹏;韩延超 | 申请(专利权)人: | 北京中科凡语科技有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/226;G06F40/194;G06F40/189 |
| 代理公司: | 北京庚致知识产权代理事务所(特殊普通合伙) 11807 | 代理人: | 韩德凯;李伟波 |
| 地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 校正 术语 自动 定位 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种校正术语对的自动定位方法,包括:S1、获得源语言语句的机器翻译结果,以及对机器翻译结果进行校正后的校正翻译结果;S2、对机器翻译结果和校正翻译结果进行文本对比,获得用于定位至少一个校正术语对中每个校正术语对的至少一个候选查询词,以及对源语言语句和校正翻译结果进行词对齐,获得词对齐结果;以及S3、对用于定位至少一个校正术语对中每个校正术语对的至少一个候选查询词和词对齐结果进行匹配,获得源语言语句及校正翻译结果中的至少一个校正术语对。本公开还提供了校正术语对的自动定位装置、电子设备及存储介质。
技术领域
本公开属于语言处理技术领域,本公开尤其涉及一种校正术语对的自动定位方法、装置、电子设备及存储介质。
背景技术
计算机辅助翻译系统(CAT)借助计算机化工具辅助翻译人员完成翻译任务,核心是通过以机器翻译为主的各种自然语言处理技术,使繁重、复杂的人工翻译过程自动化,从而提高翻译效率和翻译质量。CAT系统首先通过机器翻译模型和记忆库将源语言翻译为目标语言,随后译员针对机器翻译结果进行人工校正,形成一篇高质量译文。对于一些专业领域词汇和不常见的单词,机器翻译结果往往存在错漏译情况,需要译员对翻译结果逐词逐句进行校正。为避免系统对于译员已经校正过的单词重复错漏译,则需将错漏译的源语言单词和经过校正的目标语言单词的准确译法保存为术语对存入术语记忆库。
目前译员使用计算机辅助翻译系统添加术语对时,需要手动选择或在系统特定位置输入源语言单词以及经过校正的目标语言单词的准确译法,这种方式在操作上较为复杂,与机器翻译结果的校正工作存在重复性,使得系统的自动化程度较低、译员翻译的效率不高。
发明内容
为了解决上述技术问题中的至少一个,本公开提供了一种校正术语对的自动定位方法、装置、电子设备及存储介质。校正术语对为机器翻译结果的校正术语对。
根据本公开的一个方面,提供一种校正术语对的自动定位方法,包括:S1、获得源语言语句的机器翻译结果,以及对所述机器翻译结果进行校正后的校正翻译结果;S2、对所述机器翻译结果和所述校正翻译结果进行文本对比,获得用于定位至少一个校正术语对中每个校正术语对的至少一个候选查询词,以及对所述源语言语句和所述校正翻译结果进行词对齐,获得词对齐结果;以及S3、对用于定位所述至少一个校正术语对中每个校正术语对的至少一个候选查询词和所述词对齐结果进行匹配,获得所述源语言语句及校正翻译结果中的至少一个校正术语对。
根据本公开的至少一个实施方式的校正术语对的自动定位方法,所述校正翻译结果为译员校正后的校正翻译结果。
根据本公开的至少一个实施方式的校正术语对的自动定位方法,每个校正术语对的至少一个候选查询词通过以下方法获得:对所述机器翻译结果和所述校正翻译结果进行文本对比,获得所述校正翻译结果中的至少一个校正字符;以及基于所述至少一个校正字符,使用滑动窗口的方法获得用于定位至少一个校正术语对中每个校正术语对的至少一个候选查询词。
根据本公开的至少一个实施方式的校正术语对的自动定位方法,所述校正字符包括增加字符和/或删除字符。
根据本公开的至少一个实施方式的校正术语对的自动定位方法,对所述源语言语句和所述校正翻译结果进行词对齐,获得词对齐结果,包括:SS1、将源语言语句和所述校正翻译结果即目标语言语句组成句对,分别对所述源语言语句以及所述目标语言语句进行分词;SS2、使用专业领域词典对所述分词后的句对中的单词进行对齐,获得专业领域词典能够对齐的单词对,作为词典对齐结果;SS3、对所述源语言语句中的每个词与所述目标语言语句中的每个词进行正向对齐,获得正向对齐能够对齐的单词对,作为正向对齐结果;SS4、对于步骤SS3中未能够正向对齐的词进行反向对齐,获得反向对齐能够对齐的单词对,作为反向对齐结果;以及SS5、将词典对齐结果、正向对齐结果以及反向对齐结果作为初级对齐结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科凡语科技有限公司,未经北京中科凡语科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011305060.6/2.html,转载请声明来源钻瓜专利网。





