[发明专利]一种基于强制解码的动态抽取翻译模板的方法有效
申请号: | 201610420062.7 | 申请日: | 2016-06-13 |
公开(公告)号: | CN107491441B | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 王强;杨木润;肖桐;朱靖波 | 申请(专利权)人: | 沈阳雅译网络技术有限公司 |
主分类号: | G06F40/42 | 分类号: | G06F40/42;G06F40/58 |
代理公司: | 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 | 代理人: | 李晓光 |
地址: | 110003 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于强制解码的动态抽取翻译模板的方法,步骤为:输入双语句子级平行数据,分别对源语和目标语分词,得到平行句对;用基于短语的统计机器翻译系统对每一个平行句对进行强制解码,获取翻译推导信息及短语对对齐信息;输入待翻译的源语句子进行分词,得到分词后的待翻译的源语句子;从平行句对中挑选出与分词后的待翻译的源语句子最相似的平行句对以及二者间的差异项;对对齐信息、从分词后的平行句对中挑选与分词后的待翻译的源语句子最相似的平行句对以及二者间的差异项动态生成翻译模板。本发明避免了非终结符粒度过大而错过最佳翻译模板以及非终结符粒度过小而无法应用翻译模板,提高了翻译模板的覆盖度和使用率以及翻译准确度。 | ||
搜索关键词: | 一种 基于 强制 解码 动态 抽取 翻译 模板 方法 | ||
【主权项】:
一种基于强制解码的动态抽取翻译模板的方法,其特征在于包括以下步骤:1)输入双语句子级平行数据,分别对源语和目标语分词,得到分词后的平行句对;2)用基于短语的统计机器翻译系统对每一个分词后的平行句对进行强制解码,获取翻译推导信息及短语对对齐信息;3)输入待翻译的源语句子,对待翻译的源语句子进行分词,得到分词后的待翻译的源语句子;4)从分词后的平行句对中挑选出与分词后的待翻译的源语句子最相似的平行句对以及二者间的差异项;5)利用翻译推导信息及短语对对齐信息、从分词后的平行句对中挑选与分词后的待翻译的源语句子最相似的平行句对以及二者间的差异项动态生成翻译模板。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳雅译网络技术有限公司,未经沈阳雅译网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610420062.7/,转载请声明来源钻瓜专利网。