[发明专利]通过动态学习提取规则来获取词表外的翻译有效
| 申请号: | 200980161654.X | 申请日: | 2009-09-25 |
| 公开(公告)号: | CN102550049A | 公开(公告)日: | 2012-07-04 |
| 发明(设计)人: | 史磊 | 申请(专利权)人: | 雅虎公司 |
| 主分类号: | H04W4/00 | 分类号: | H04W4/00 |
| 代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宋鹤 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 通过 动态 学习 提取 规则 获取 词表 翻译 | ||
1.一种方法,包括:
在双语网页中识别一个或多个双语术语对的集合,其中双语术语对包括第一语言的第一术语和第二语言的第二术语;
至少部分地基于所述双语网页中的所述一个或多个双语术语对的布局,识别一个或多个候选模式;
在每个候选模式中识别一个或多个特征;
至少部分地基于每个候选模式的一个或多个特征,选择第一候选模式;
至少部分地基于所述第一候选模式,在所述双语网页中识别候选翻译对的集合;
其中,所述方法由一个或多个专用计算设备执行。
2.根据权利要求1所述的方法,还包括:
验证来自所述候选翻译对的集合的候选翻译对;
至少部分地基于所述验证,将所述候选翻译对归类为翻译对或者不是翻译对。
3.根据权利要求2所述的方法,其中,响应于多于阈值数目的候选翻译对没有通过验证,所有候选翻译对均被归类为不是翻译对。
4.根据权利要求1所述的方法,其中,识别所述第一候选模式的处理包括:
识别第一双语术语对;
向所述双语术语对的第一术语指派第一通用标志;
向所述双语对的第二术语指派第二通用标志;
向所述第一术语和所述第二术语之间的术语或者标签指派非通用标志。
5.根据权利要求4所述的方法,其中,识别所述一个或多个候选模式的集合的处理还包括:
向所述第一双语术语对之前或之后的术语或者标签指派第三通用标志。
6.根据权利要求4所述的方法,其中,如果对应于第二双语术语对的标志与对应于所述第一双语术语对的标志相匹配,则所述第二双语术语对与所述第一候选模式相匹配。
7.根据权利要求1所述的方法,其中,所述一个或多个特征包括识别已知的作为翻译的双语术语对。
8.根据权利要求1所述的方法,其中,每个候选模式的一个或多个特征被用来确定所述一个或多个候选模式的排名,并且其中选择所述第一候选模式的处理至少部分地基于所述排名。
9.根据权利要求2所述的方法,其中,验证所述候选翻译对的处理包括:确定所述候选翻译对是否具有相对于其他候选翻译对的一对一的对应关系。
10.一个或多个存储介质,存储有以下指令,其中当所述指令被一个或多个计算设备执行时导致根据权利要求1所述的方法的执行。
11.一个或多个存储介质,存储有以下指令,其中当所述指令被一个或多个计算设备执行时导致根据权利要求2所述的方法的执行。
12.一个或多个存储介质,存储有以下指令,其中当所述指令被一个或多个计算设备执行时导致根据权利要求3所述的方法的执行。
13.一个或多个存储介质,存储有以下指令,其中当所述指令被一个或多个计算设备执行时导致根据权利要求4所述的方法的执行。
14.一个或多个存储介质,存储有以下指令,其中当所述指令被一个或多个计算设备执行时导致根据权利要求5所述的方法的执行。
15.一个或多个存储介质,存储有以下指令,其中当所述指令被一个或多个计算设备执行时导致根据权利要求6所述的方法的执行。
16.一个或多个存储介质,存储有以下指令,其中当所述指令被一个或多个计算设备执行时导致根据权利要求7所述的方法的执行。
17.一个或多个存储介质,存储有以下指令,其中当所述指令被一个或多个计算设备执行时导致根据权利要求8所述的方法的执行。
18.一个或多个存储介质,存储有以下指令,其中当所述指令被一个或多个计算设备执行时导致根据权利要求9所述的方法的执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅虎公司,未经雅虎公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980161654.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:四支链二自由度平动高速并联机构
- 下一篇:自动跟踪全缝滚焊/切割机械手





