[发明专利]通过分析用户的自校正搜索行为识别搜索字符串的备选拼写有效
申请号: | 200680037981.0 | 申请日: | 2006-07-20 |
公开(公告)号: | CN101288046A | 公开(公告)日: | 2008-10-15 |
发明(设计)人: | 埃里克·R·瓦顿;罗纳德·M·惠特曼;兰德尔·M·亨尼 | 申请(专利权)人: | 亚马逊技术有限公司 |
主分类号: | G06F7/00 | 分类号: | G06F7/00;G06F17/00 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 王波波 |
地址: | 美国内*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 分析 用户 校正 搜索 行为 识别 字符串 备选 拼写 | ||
1.一种计算机实现的方法,包括:
分析多个用户中的每个用户的搜索字符串提交,以检测搜索字符串拼写变化事件,每个搜索字符串拼写变化事件是这样的事件:用户向搜索引擎提交第一搜索字符串,并在随后向搜索引擎提交在拼写上与第一搜索字符串相似但不相同的第二搜索字符串;以及
对于所述搜索字符串提交中所包括的多个搜索字符串中的每个搜索字符串,识别各个搜索字符串的一个或者更多备选拼写,其中,至少部分地通过对检测到的搜索字符串拼写变化事件进行分析来识别所述备选拼写。
2.根据权利要求1所述的方法,其中,分析检测到的拼写变化事件包括:至少部分地通过估计从字符串A到字符串B的拼写变化是否明显地比从字符串B到字符串A的拼写变化更加频繁出现,来评估字符串B是否是字符串A的有用备选拼写。
3.根据权利要求1所述的方法,其中,分析检测到的拼写变化事件包括:通过考虑对字符串A作出拼写变化的用户如何频繁地通过提交字符串B来对字符串A进行拼写变化,来评估字符串B是否是字符串A的有用备选拼写。
4.根据权利要求1所述的方法,其中,分析搜索字符串提交包括:计算所述多个用户中的特定用户所提交的搜索字符串之间的编辑距离。
5.根据权利要求1所述的方法,其中,所述拼写变化事件包括这样的事件:用户在第一搜索字符串提交与第二搜索字符串提交之间执行一个或更多中间搜索。
6.根据权利要求1所述的方法,其中,分析检测到的拼写变化事件包括:对于从字符串A到字符串B的拼写变化,分析提交字符串A和字符串B的用户的动作,以评估字符串B对于提交字符串A的用户的有用性。
7.根据权利要求6所述的方法,其中,评估字符串B对于提交字符串A的用户的有用性包括:分析提交字符串B的用户的浏览动作,以评估这些用户是否满意与字符串B相对应的搜索结果。
8.根据权利要求6所述的方法,其中,评估字符串B对于提交字符串A的用户的有用性包括:考虑字符串A与字符串B之间的编辑距离。
9.根据权利要求6所述的方法,其中,评估字符串B对于提交字符串A的用户的有用性包括:考虑从字符串A到字符串B的拼写变化是否比从字符串B到字符串A的拼写变化更有可能发生。
10.根据权利要求1所述的方法,其中,分析检测到的拼写变化事件包括:给不同的拼写变化事件分配不同的权重,所述权重取决于在相应的拼写变化事件发生的浏览会话中执行的其他用户动作。
11.根据权利要求10所述的方法,其中,分析检测到的拼写变化事件还包括:对于特定的拼写变化,结合包括所述特定拼写变化的多个事件的权重来产生针对所述拼写变化的权重。
12.根据权利要求1所述的方法,其中,分析检测到的拼写变化事件包括:至少部分地基于作为其中发生拼写变化事件的浏览会话的一部分而执行的其他用户动作,对所述拼写变化事件进行加权。
13.根据权利要求1所述的方法,其中,分析检测到的拼写变化事件包括:给最近的拼写变化事件赋予比较早的拼写变化事件更大的权重。
14.根据权利要求1所述的方法,还包括在计算机存储器中生成从所述多个搜索字符串中的特定搜索字符串到相应的备选搜索字符串的映射。
15.根据权利要求14所述的方法,还包括使用所述映射来向用户建议所述备选搜索字符串拼写。
16.根据权利要求14所述的方法,还包括使用所述映射来自动校正用户所提交的搜索字符串中的拼写错误。
17.一种体现权利要求1所述的方法的计算机程序,所述计算机程序被提供在计算机存储器中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亚马逊技术有限公司,未经亚马逊技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680037981.0/1.html,转载请声明来源钻瓜专利网。