[发明专利]翻译方法、装置及计算机可读存储介质在审
| 申请号: | 202210750918.2 | 申请日: | 2022-06-29 |
| 公开(公告)号: | CN115099248A | 公开(公告)日: | 2022-09-23 |
| 发明(设计)人: | 田亮;贾丽莉 | 申请(专利权)人: | 新译信息科技(北京)有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58 |
| 代理公司: | 深圳市恒程创新知识产权代理有限公司 44542 | 代理人: | 苗广冬 |
| 地址: | 101100 北京市通州区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 翻译 方法 装置 计算机 可读 存储 介质 | ||
本发明公开了一种翻译方法、装置及计算机可读存储介质,其中,所述翻译方法包括:确定源端文件中的源端文本以及样式标签之间的第一位置关系;根据所述第一位置关系,在所述源端文件中提取所述源端文本;确定所述源端文本对应的目标端文本;根据所述目标端文本、所述样式标签以及所述第一位置关系,生成与所述源端文件对应的目标端文件,本发明旨在提高机器翻译的完整性。
技术领域
本发明涉及机器翻译领域,尤其涉及一种翻译方法、装置及计算机可读存储介质。
背景技术
随着经济全球化及互联网的飞速发展,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。
在机器翻译对源端文件进行翻译的过程中,通常会将文本和样式标签一起进行机器翻译,样式标签是对文本内容进行样式转换的标识,样式标签会切断句子,在翻译过程中会影响机器翻译的结果,导致机器翻译的完整性不高。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种翻译方法、装置及计算机可读存储介质,旨在达成提高机器翻译的完整性的效果。
为实现上述目的,本发明提供一种翻译方法,所述翻译方法包括以下步骤:
确定源端文件中的源端文本以及样式标签之间的第一位置关系;
根据所述第一位置关系,在所述源端文件中提取所述源端文本;
确定所述源端文本对应的目标端文本;
根据所述目标端文本、所述样式标签以及所述第一位置关系,生成与所述源端文件对应的目标端文件。
可选地,所述根据所述目标端文本、所述样式标签以及所述第一位置关系,生成与所述源端文件对应的目标端文件的步骤包括:
根据词语对齐结果以及所述第一位置关系,确定所述目标端文本与所述中样式标签之间的第二位置关系;
根据所述第二位置关系,确定所述样式标签在所述目标端文本中的插入位置;
根据所述插入位置将所述样式标签插入所述目标端文本,生成目标端文件。
可选地,所述确定源端文件中的源端文本以及样式标签之间的第一位置关系的步骤包括:
确定所述源端文件的中的文本样式变更节点;
根据所述变更节点的节点位置,确定所述第一位置关系。
可选地,所述根据所述第一位置关系,在所述源端文件中提取所述源端文本的步骤包括:
根据在所述节点位置前,或者所述节点位置对应的所述源端文本的文本样式确定所述样式标签的功能特征;
将所述样式标签从所述源端文件中剔除,并将所述样式标签、所述功能特征和第一位置关系关联保存;
保留剔除所述样式标签后的所述源端文件作为所述源端文本。
可选地,所述根据所述目标端文本、所述样式标签以及所述第一位置关系,生成与所述源端文件对应的目标端文件的步骤包括:
根据所述第一位置关系将与所述第一位置关系关联的样式标签插入所述目标端文本中;
根据与所述样式标签关联的功能特征设置所述目标端文本的文本样式,生成所述目标端文件。
可选地,所述确定所述源端文本对应的目标端文本的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新译信息科技(北京)有限公司,未经新译信息科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210750918.2/2.html,转载请声明来源钻瓜专利网。





