[发明专利]机器翻译评价方法和设备及机器翻译方法和设备在审
申请号: | 201510824703.0 | 申请日: | 2015-11-24 |
公开(公告)号: | CN106776583A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 王晓利;张永生 | 申请(专利权)人: | 株式会社NTT都科摩 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 胡琪 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 评价 方法 设备 | ||
技术领域
本公开总体涉及机器翻译,具体涉及用于跨语言问答系统的机器翻译评价方法和设备以及机器翻译方法和设备。
背景技术
跨语言问答系统(Cross-language question answering system)是跨语言信息检索技术在自动问答系统中运用的产物,比起单语种的自动问答系统,跨语言问答系统需要涉及更为复杂的跨语言、信息检索等处理技术。其要求系统接收用户以源语言表述的问题作为输入、系统自动在另一语种的语料库中找到关于这个问题的最佳答案、并将此答案以源语言的形式返回给用户。由于系统接收的问题的语种与语料库的语种不一致,因此为了进行跨语种检索,需要通过机器翻译进行语种的转换。针对这一语种的转换,可以采用两种不同的思路,一种是将源语言的问题转化(翻译)为与语料库相同的语言,然后使用针对语料库的语种设计的问答系统来获取答案,另一种是通过机器翻译将整个语料库转化为与源语言相同的语言,然后在转化后的语料库中获取答案。可以看出,无论采用哪种思路,机器翻译的好坏对问答系统的性能都有着非常重要的影响。
由于上述第二种思路中需要将整个语料库转化为与源语言相同的语言,工作负荷很重,因此,目前本领域中的研究更多地集中在第一种思路上。具体的,当前针对将源语言的问题转化为与语料库相同的语言的机器翻译已经提出了许多具体的方法。相应的,为了确定翻译的质量,研究人员进行了很多研究以期对翻译结果进行评价,从而选择翻译质量较高的翻译。然而,现有的各种翻译评价方法在可靠性和通用性上不能令人满意。例如,美国专利申请US2012330990公开了一种跨语言查询建议的评价方法,其确定各个候选翻译在目标语言查询日志中的出现频率,并选择出现频率最高的候选翻译作为翻译质量最高的翻译。然而按照方法,在候选翻译漏译了源语言中的某些词时,会导致其在目标语言查询日志中的出现频率较高,另外,有时在某 些特定词翻译错误时也会导致较高的出现频率,从而导致错误的翻译评价。再比如,日本专利申请WO2013014877A1公开了一种根据源语言和目标语言的翻译的反向翻译结果之间的距离来评估翻译可靠性的方法。然而,该方法需要从源语言翻译成目标语言、以及从目标语言反向翻译成源语言的两种翻译模型,而且从目标语言反向翻译成源语言的性能也会影响评价的可靠性。
发明内容
至少针对以上问题提出本公开。
根据本公开的一个实施例,提供了一种用于跨语言问答系统的机器翻译评价方法,包括:对于源语言查询语句和通过机器翻译得到的对应的目标语言查询语句分别进行语义角色标注;计算源语言查询语句中每个被标注的论元与目标语言查询语句中每个被标注的论元的对齐概率;和基于所计算的各个对齐概率,确定所述目标语言查询语句的翻译质量。
根据本公开的另一实施例,提供了一种用于跨语言问答系统的机器翻译方法,包括:接收要翻译的第一语言的内容,并判断该第一语言的内容的类型;基于所确定的类型选择适合于该类型的多个翻译引擎;利用所述多个翻译引擎分别对所述第一语言的内容进行翻译,得到多个第二语言的候选翻译;对每个第二语言的候选翻译的翻译质量进行打分,并选择得分最高的候选翻译作为所述第一语言的内容的翻译。
根据本公开的另一实施例,提供了一种用于跨语言问答系统的机器翻译评价设备,包括:标注部件,配置为对于源语言查询语句和通过机器翻译得到的对应的目标语言查询语句分别进行语义角色标注;对齐部件,配置为计算源语言查询语句中每个被标注的论元与目标语言查询语句中每个被标注的论元的对齐概率;和评价部件,配置为基于所计算的各个对齐概率,确定所述目标语言查询语句的翻译质量。
根据本公开的又一实施例,提供了一种用于跨语言问答系统的机器翻译设备,包括:判断部件,配置为接收要翻译的第一语言的内容,并判断该第一语言的内容的类型;选择部件,配置为基于所确定的类型选择适合于该类型的多个翻译引擎;翻译部件,配置为利用所述多个翻译引擎分别对所述第一语言的内容进行翻译,得到多个第二语言的候选翻译;确定部件,配置为对每个第二语言的候选翻译的翻译质量进行打分,并选择得分最高的候选翻 译作为所述第一语言的内容的翻译。
根据本公开实施例的机器翻译评价技术提出了一种利用语义角色标注、基于论元对齐概率的新颖的机器翻译评价方案,通过该方法能够提供较为准确的机器翻译评价,进而提高跨语言问答系统的性能。根据本公开实施例的机器翻译技术对于不同类型的待翻译内容选用适合于该类型的不同翻译引擎,并且对于每种类型的翻译内容采用多个翻译引擎进行翻译,从而对于各种类型的待翻译内容都能提供较好的翻译结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社NTT都科摩,未经株式会社NTT都科摩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510824703.0/2.html,转载请声明来源钻瓜专利网。