[发明专利]对结构化数据进行搜索的方法、系统以及使数据项结构化及可搜索的方法、系统有效

专利信息
申请号: 201010156907.9 申请日: 2005-12-13
公开(公告)号: CN101866347B 公开(公告)日: 2017-05-17
发明(设计)人: 宾杜·雷迪;乔纳森·布伦斯曼;宁·莫斯贝格尔;戈拉夫·拉温德拉·布哈亚;萨拉·西拉杰丁;大卫·卡莱;珍妮弗·L·克森斯基;阿尔文德·孙达瑞拉简;普涅特·阿加瓦尔 申请(专利权)人: 谷歌公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中原信达知识产权代理有限责任公司11219 代理人: 张焕生,安翔
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 结构 数据 进行 搜索 方法 系统 以及 数据项
【说明书】:

相关申请

依据美国专利法第35号第119条(e)款(35 U.S.C.§119(e)),本申请以申请号为11/257,282的美国实用申请为优先权,其标题为“对结构化数据的搜索”,由Reddy等人于2005年10月23日提出申请。本申请与申请号为11/256,883的美国申请有关,其标题为“向结构化数据添加属性及标签”,由Reddy等人于2005年10月23日提出申请,通过引用将其结合于此。

背景技术

常规搜索引擎能够搜索非常巨大的信息集合,诸如万维网或极其巨大的数据库。当所搜索的数据集合的规模增长时,常规搜索引擎不再足够来正确地返回与用户输入的查询词相匹配的查询结果。替代地,需要提供机制来帮助用户拣选从搜索返回的大量数据。

当前几个常规搜索引擎使用不同的方法来组织在搜索结果中返回的数据。

此种组织方法的目的是判定哪个搜索结果将使用户发生最大兴趣。常规搜索引擎通常使用多种技术来以优先顺序排列搜索结果,但是这些技术不理想,因为其必须对用户正搜索的信息的类型做出假设。例如,如果用户输入“工作”,他可能是搜索工作公告、史蒂夫乔布(Steve Jobs)的信息、特定国家的工作统计量、或许多其它项。因此,当使用常规搜索引擎时,用户不能仅输入“工作”作为查询词。用户也很可能输入另外的查询词以缩小搜索范围。遗憾的是,用户也可能错过不包含缩小词的相关收录。

当前,对可能存储在万维网上或不存储在万维网上的不同类型的数据进行搜索是困难的。通常常规搜索引擎对仅仅来自少数源的数据进行操作。例如,基于网络的搜索引擎传统上允许用户搜索在万维网上的页面。网络搜索引擎常常具有对信息集合进行索引以使其可搜索的“后台(back-end)”。例如,基于网络的搜索引擎周期性地爬行(crawl)万维网并且创建所爬行的页面以及站点的索引。其它搜索引擎允许用户搜索现有的数据库。此种搜索引擎依赖于数据库的预先确定的组织。例如,如果数据库具有已知字段以及属性,用户就能够在其属性内搜索。例如,XML数据库仅接受格式完好(well-formed)的XML输入。如果被搜索的数据不是如此组织的,一般XML数据库不能接受该数据或不能组织该数据以用于搜索。

其它搜索引擎允许用户搜索数据库或搜索具有扁平式组织的文本文档。此种搜索引擎必须知道关于数据库的组织以及在数据库内的文档的组织。存储数据的位置的多样性以及存储数据的格式的多样性,意味着用户必须经常在多个数据库中的多个位置搜索以找到其需要的信息。

所需要的是,可以通过基于网络的搜索引擎来搜索文档集合,以及因而多数人可容易地访问所述文档集合,同时所述文档集合包含了各种类型的文档以及数据格式。此外,如果以能够帮助用户对其搜索进行微调的方法来组织可搜索的文档集合,这将也是所需要的。

发明内容

本发明的一个方面涉及一种用于对结构化数据进行搜索的计算机实现的方法,该方法包括:从集合中的数据项提取属性;通过客户端设备从与搜索引擎交互的用户接收搜索查询;接收对来自所述数据项集合的第一数据项的选择,所述第一数据项满足所述搜索查询,并且所述第一数据项共同具有已被从所述第一数据项提取的第一属性;从所述第一属性中选择最普遍的属性作为核心组的属性;向所述客户端设备输出搜索引擎结果页面,所述搜索引擎结果页面包括指向所述第一数据项中的每一个的相应引用,以及所述核心组的每一个属性的相应表示;响应于对所述核心组的一个或多个属性的表示的用户选择,提供与所述核心组的所选择的一个或多个属性相对应的用于接收查询优化的搜索窗口;以及接收对满足所述搜索查询和所述查询优化的第二数据项的选择。

本发明的另一个方面涉及一种用于使数据项结构化和可搜索的计算机实现的方法,该方法包括:接收并存储被一个或多个提供者拥有的数据;提供用户界面由所述一个或多个提供者中的每一个使用,所述用户界面包括由所述一个或多个提供者中的任何一个用来将标签或属性人工关联到他们所拥有的数据的区域;通过所述用户界面从所述一个或多个提供者接收与相应提供者拥有的数据有关的标签或属性,所述属性的每一个包括属性名称和属性值;对所接收的标签或属性进行索引;以及使用所索引的标签或属性来在搜索引擎中生成搜索引擎结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010156907.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top