[发明专利]代理排名无效
| 申请号: | 200680037368.9 | 申请日: | 2006-08-08 |
| 公开(公告)号: | CN101283354A | 公开(公告)日: | 2008-10-08 |
| 发明(设计)人: | 大卫·米诺谷;保罗·A·图克尔 | 申请(专利权)人: | 谷歌公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 郑立;林月俊 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 代理 排名 | ||
技术领域
本发明涉及对链接的信息源的搜索和排名。
背景技术
信息检索(IR)涉及在大的语料库中查找所想要的信息单元。搜索引擎是IR系统的一个例子,其使得文档(通常但不必然限于文本)能够基于它们相对于用户所提出的简明查询的相关度而从大的文献中被检索出来。文档被检索或提供的顺序是搜索引擎所创建的排名:相对于该查询,排名最高的文档被最先返回或提供。搜索引擎排名可能受到从属于查询和独立于查询的标准的影响。从属于查询的标准一般试图识别文档在语义上与查询相关的程度。例如字频分布的对应。独立于查询的标准常常试图识别文档一般“良好的”的程度,例如有权威性的、可理解的、非欺诈性的或非欺骗性的程度。独立于查询的标准的例子有检查文档语料库的链接结构的PageRank算法或类似算法所计算的分值。
如上所述,独立于查询的标准能够提供测量特定信息源的权威性的方式。例如,指向特定信息源的信息源越多,则该信息源得到的搜索评定分值(search rating score)就越高,并且它被判断为越有权威性。在一些实例中,搜索评定算法是递归的,意味着信息源的搜索评定分值不仅基于引用原始信息源的信息源数目,而且还基于发起引用的信息源的搜索评定分值。换言之,信息源的搜索评定分值是基于发起引用的信息源的数目和质量两者的。
对于某些信息源,全部的内容都在单个代理的控制之下。在这样的情况下,代理的信誉(reputation)能够直接与信息源的内容有关。然而在其它情况下,控制可以在几个代理之间进行委托,每个代理控制信息源的一个区段。在这些区段能够被识别的意义上,能够在区段的层级上计算代理信誉。
然而,一般难以使信息源上的内容与负责创建或发布该内容的代理相关联。例如,单个作者可以将内容投向多个信息源,单个信息源之内的内容可以源自多个代理,或者信息源的所有权和控制可以随时间而变化。作为另一个例子,单个网页能够包含由多个代理控制的内容,诸如与新闻文章并排出现的广告。
发明内容
本发明提供了方法和设备,包括计算机程序产品,实现对链接的信息源(linked information source)进行搜索和排名的技术。
在一个方面,该技术包括:从内容项目语料库中接收多个内容项目;接收每个由多个代理中的一个制作的数字签名,每个数字签名使代理中的一个与内容项目中的一个或多个相关联;以及给多个代理中的第一代理赋予分值,其中,所述分值是基于通过所述数字签名与所述第一代理相关联的内容项目的。
本发明的实施方式可以包括以下特征中的一个或多个。该技术可以进一步包括确定数字签名的有效性。如果没有数字签名使代理与特定内容项目相关联,则该内容项目与该特定内容被发现的位置的所有者相关联,并且基于该特定内容项目给该所有者赋予分值。与第一代理相关联的内容项目包括这样的内容项目,该内容项目包含使第一代理与该内容项目相关联的数字签名。与第一代理相关联的内容项目包括这样的内容项目,该内容项目包括指向使第一代理与该内容项目相关联的数字签名的链接。与第一代理相关联的内容项目包括这样的内容项目,该内容项目为网站或网站的一部分。第二代理通过第二数字签名与第一代理与其相关联的第二内容项目相关联,并且第二代理作出关于该内容项目的声明(assertion)。第一代理用数字签名作出第一代理是第二内容项目的作者的声明。第二代理用第二数字签名作出第二代理是第二内容项目的审核者的声明。第二代理用第二数字签名作出第二代理是第二内容项目的编者的声明。第二代理用第二数字签名作出第二代理是第二内容项目的出版者的声明。给第一代理赋予分值可以包括基于未签署的内容项目来赋予分值,其中作为所述未签署的内容项目被发现的一个或多个位置的所有者的第一代理与所述未签署的内容项目相关联。给第一代理赋予分值可以包括基于一个或多个其它代理关于与第一代理相关联的内容项目所作出的一个或多个声明来赋予分值。向第一代理赋予分值可以包括基于第一代理作出的一个或多个声明来赋予分值。所述分值用于对语料库的搜索结果进行排序。
能够实施本发明的特定实施例以实现以下优点中的一个或多个。负责内容的个体代理的身份能够用于影响搜索评定。代理的身份能够可靠地与内容相关联。关联的粒度能够小于整个网页,使得代理能够使其自身与出现在该代理所负责的信息附近的信息相脱离。代理能够否认与出现在代理的网站上的诸如广告之类的部分内容的关联性。相同的代理身份能够被附着到多个位置处的内容。多个代理能够对单个网页作出贡献,其中每个代理仅关联到该代理所提供的内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680037368.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:含过氧化氢和螯合羧酸的磷化液
- 下一篇:碾磨系统





