[发明专利]用于查询扩展的音译有效
申请号: | 200910164542.1 | 申请日: | 2009-07-20 |
公开(公告)号: | CN101630333A | 公开(公告)日: | 2010-01-20 |
发明(设计)人: | 皮尤什·普拉拉德卡;拉利特什·卡特拉嘎达;维内特·古普塔 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 张焕生;安 翔 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 查询 扩展 音译 | ||
1.一种识别用于查询扩展的音译词语的候选同义词的方法,包括:
使用一个或多个计算机识别目标语言的多个音译词语,其中识别 所述目标语言的所述多个音译词语包括:
从web资源识别包含仅仅所述目标语言的字符的词语,
计算用于包含仅仅所述目标语言的字符的词语中的每个识别 的词语的统计量,其中用于每个识别的词语的所述统计量是基于:与 讲源语言的一个或多个地区相关联的web资源中所述识别的词语的出 现概率相对于与任何地区相关联的web资源中所述识别的词语的出现 概率的比率;
将用于每个识别的词语的所述统计量与指定的阈值进行比 较;以及
如果用于特定的识别的词语的统计量超过所指定的阈值,则 将所述特定的识别的词语包括在所述目标语言的所述多个音译词语 中;
对于所述目标语言的所述多个音译词语中的每个音译词语,将所 述音译词语映射到所述源语言的一个或多个词语;以及
对于所述目标语言的所述多个音译词语中的第一音译词语,识别 所述目标语言的所述多个音译词语中的一个或多个第二音译词语作为 所述第一音译词语的候选同义词,其中所述一个或多个第二音译词语 中的每一个被映射到也从所述第一音译词语映射的所述源语言的至少 一个词语。
2.根据权利要求1所述的方法,其中用于每个识别的词语的所述 统计量是与讲所述源语言的一个或多个地区相关联的顶级域的web资 源中所述识别的词语的出现概率相对于与任何地区相关联的顶级域的 web资源中所述识别的词语的出现概率的比率。
3.根据权利要求1所述的方法,其中与讲所述源语言的一个或多 个地区相关联的web资源通过所述web资源的顶级域来确定。
4.根据权利要求1所述的方法,其中将所述音译词语映射到所述 源语言的一个或多个词语进一步包括:
将所述目标语言的所述音译词语音译为所述源语言的所述一个或 多个词语。
5.根据权利要求4所述的方法,其中被识别为所述第一音译词语 的候选同义词的所述一个或多个第二音译词语中的每一个具有超过指 定阈值的相对于所述第一音译词语的置信值。
6.根据权利要求5所述的方法,其中第二音译词语的所述置信值 是从所述第一音译词语和所述第二音译词语两者映射的所述源语言的 词语的数目的函数。
7.根据权利要求5所述的方法,其中将所述目标语言的所述音译 词语音译为所述源语言的词语进一步包括:
产生用于所述目标语言的所述音译词语到所述源语言的所述词语 的所述音译的音译分值。
8.根据权利要求7所述的方法,其中第二音译词语的所述置信值 是web资源中所述第二音译词语的出现概率、用于所述第二音译词语到 也从所述第一音译词语映射的所述源语言的词语的所述音译的音译分 值、以及用于所述第一音译词语到所述源语言的所述词语的所述音译 的音译分值中的一个或多个的函数。
9.根据权利要求1所述的方法,进一步包括:
对于所述目标语言的所述多个音译词语中的所述第一音译词语, 识别从所述第一音译词语映射的和从所述一个或多个第二音译词语中 的至少一个映射的所述源语言的一个或多个词语作为所述第一音译词 语的候选同义词。
10.根据权利要求1所述的方法,进一步包括:
接收包括所述第一音译词语的查询;
利用所述第一音译词语的所述候选同义词中的一个或多个扩展所 述查询;
将所述扩展的查询提供到搜索引擎;以及
接收用于所述扩展的查询的搜索结果。
11.根据权利要求1所述的方法,进一步包括:
接收包括所述第一音译词语的查询;以及
提供一个或多个扩展的查询供用户选择,每个扩展的查询包括所 述查询以及所述第一音译词语的所述候选同义词中的一个或多个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910164542.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:投影系统
- 下一篇:修复管用管段、及使用该管段的既设管修复方法