[发明专利]基于领域相似性度量方法的统计机器翻译方法无效
申请号: | 201310689351.3 | 申请日: | 2013-12-16 |
公开(公告)号: | CN103631773A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | 曹海龙;刘淋;赵铁军;郑德权;杨沐昀;徐冰;朱聪慧 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 张宏威 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 于领域相似性度量方法的统计机器翻译方法,涉及机器翻译技术领域。它解决了现机器翻译技术中选取平行语料的方法中,采用余弦函数与词频来作为领域间相似性的度工具并不能反应实际的相似程度以及忽略了文字背后的语义关联,而导致选取的平行语不能反映实际含义、最终影响翻译结果准确性的问题。本发明是在现有统计机器翻译方法中,在从双语平行的训练语料库中选取与翻译文本的领域相似性高的若干篇文档作为训练语料,其中判断相似性的方法为:用相对词频或主题模型作为特征代表,采用余弦距离数、变分距离函数、欧式距离函数、偏斜距离函数或者JS距离函数作为相似度函数进行档相似性度量。本发明的翻译结果更接近于人工翻译的结果。 | ||
搜索关键词: | 基于 领域 相似性 度量 方法 统计 机器翻译 | ||
【主权项】:
基于领域相似性度量方法的统计机器翻译方法,其特征在于,所述统计机器翻译方法为在现有统计机器翻译方法中,在从双语平行的训练语料库中选取与翻译文本的领域相似性高的若干篇文档作为训练语料。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310689351.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种番茄无土栽培的方法
- 下一篇:桁架臂加长节、具有该加长节的桁架臂及起重机