[发明专利]数据处理方法和装置在审
申请号: | 201611179649.X | 申请日: | 2016-12-19 |
公开(公告)号: | CN106776587A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 田亮 | 申请(专利权)人: | 新译信息科技(深圳)有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京同立钧成知识产权代理有限公司11205 | 代理人: | 杨泽,刘芳 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
技术领域
本发明涉及计算机技术,尤其涉及一种数据处理方法和装置。
背景技术
随着经济全球化和国际交流的发展,越来越多的毕业生申请到外资企业实习或工作,因此,常需要将中文简历翻译成外文简历。
机器翻译是利用计算机对人类自然语言进行自动翻译的技术,是利用计算机把一种自然语言转换成另一种自然语言的过程。具体为:当客户输入一段文本信息之后,通过机器翻译直接对该文本信息进行翻译,从而获取到该文本信息对应的翻译结果。由于现代汉语词汇丰富,同样的一个词,在不同的语境中有可能表达的意思不尽相同,这就使结构短小但信息含量庞大的简历翻译有着极大的难度。当采用机器翻译的方法来对中文简历进行字对字、词对词地翻译时,存在翻译结果繁琐及翻译结果不准确的问题。
发明内容
本发明提供一种数据处理方法,以解决现有技术中的机器翻译方法对简历进行翻译时,存在的翻译结果繁琐及翻译结果不准确的问题。
本发明第一方面提供一种数据处理方法,本发明提供的数据处理方法,包括:
获取待翻译语句的参数信息,所述参数信息包括:所述待翻译语句中的第一专业术语词汇、和/或、所述待翻译语句对应的第一模板句;
根据所述参数信息和预设的参数库,确定所述待翻译语句的翻译结果;其中,所述参数库包括预设的专业术语词汇库和预设的模板库,所述专业术语词汇库包括不同的专业术语词汇与所述专业术语词汇的翻译结果,所述模板库包括不同的模板句与所述模板句的翻译结果。
进一步地,若所述参数信息包括所述待翻译语句中的第一专业术语词汇和所述待翻译语句对应的第一模板句,所述根据所述参数信息和预设的参数库,确定所述待翻译语句的翻译结果,具体包括:
根据所述专业术语词汇库,确定所述第一专业术语词汇对应的第一翻译结果;
根据所述模板库,确定所述第一模板句对应的第二翻译结果;
根据所述第一翻译结果和所述第二翻译结果的语义匹配度,确定所述待翻译语句的翻译结果。
进一步地,所述获取待翻译语句的参数信息,具体包括;
确定所述待翻译语句中的词汇与所述专业术语词汇库的专业术语词汇的第一匹配度;
当所述第一匹配度大于预设的第一匹配阈值时,确定所述词汇为第一专业术语词汇。
进一步地,所述获取待翻译语句的参数信息,具体包括;
确定所述待翻译语句与所述模板库的模板句的第二匹配度;
将第二匹配度大于预设的第二匹配阈值的模板句确定为所述待翻译语句对应的第一模板句。
进一步地,所述获取待翻译语句的参数信息之前,所述方法还包括:
预先建立所述专业术语词汇库和所述模板库。
进一步地,所述预先建立所述专业术语词汇库和所述模板库,具体包括:
根据预设的简历属性信息遍历多份简历,将与所述简历属性信息对应的词汇确定为专业术语词汇;
对所述专业术语词汇进行翻译处理,获得所述专业术语词汇的翻译结果;
根据所述专业术语词汇和所述专业术语词汇的翻译结果,得到所述专业术语词汇库。
本发明第二方面提供一种数据处理装置,包括:获取模块和处理模块,其中,
所述获取模块,用于获取待翻译语句的参数信息,其中,所述参数信息包括:所述待翻译语句中的第一专业术语词汇、和/或、所述待翻译语句对应的第一模板句;
所述处理模块,用于根据所述参数信息和预设的参数库,确定所述待翻译语句的翻译结果;其中,所述参数库包括预设的专业术语词汇库和预设的模板库,所述专业术语词汇库包括不同的专业术语词汇与所述专业术语词汇的翻译结果,所述模板库包括不同的模板句与所述模板句的翻译结果。
进一步地,若所述参数信息包括所述待翻译语句中的第一专业术语词汇和所述待翻译语句对应的第一模板句,所述处理模块具体用于根据所述专业术语词汇库,确定所述第一专业术语词汇对应的第一翻译结果,并根据所述模板库,确定所述第一模板句对应的第二翻译结果,以及根据所述第一翻译结果和所述第二翻译结果的语义匹配度,确定所述待翻译语句的翻译结果。
进一步地,所述获取模块,具体用于确定所述待翻译语句中的词汇与所述专业术语词汇库的专业术语词汇的第一匹配度,并在所述第一匹配度大于预设的第一匹配阈值时,确定所述词汇为第一专业术语词汇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新译信息科技(深圳)有限公司,未经新译信息科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611179649.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:机器翻译方法及装置
- 下一篇:一种基于众投的译句评价方法及系统