[发明专利]宽松的过滤设置无效
申请号: | 200980149052.2 | 申请日: | 2009-11-17 |
公开(公告)号: | CN102239492A | 公开(公告)日: | 2011-11-09 |
发明(设计)人: | Y·王;T·K·多曾;D·齐;R·马宗德;G·高希;N·R·维贾亚 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/21 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈斌 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 宽松 过滤 设置 | ||
1.一个或多个在其上含有计算机可执行指令的计算机可读介质,所述计算机可执行指令用于执行检索并传送由用户通过搜索引擎提交的查询的搜索结果的方法,所述方法包括:
接收查询(402);
将查询解析成一个或多个关键字(404);
在倒排索引中搜索所述一个或多个关键字(406);
标识含有比所述一个或多个关键字中的全部关键字少的关键字的网络文档(408);
传送网络文档的列表(410)。
2.如权利要求1所述的介质,其特征在于,所述倒排索引包括链接到含有所述多个关键字的多个网络文档的多个关键字。
3.如权利要求1所述的介质,其特征在于,所述网络文档包括所述一个或多个关键字中的全部关键字减去所述一个或多个关键字中的特定量的关键字。
4.如权利要求1所述的介质,其特征在于,所述倒排索引包括一个或多个条目,每一个条目包括一关键字和含有该关键字的文档的标示。
5.如权利要求4所述的介质,其特征在于,所述标识中的每一个包括以下中的至少一个:每一个文档的文档标识符、统一资源定位器(URL)、网际协议(IP)地址。
6.如权利要求4所述的介质,其特征在于,通过路由组件不用采样地传递数据包包括从路由组件的输出接口传输数据包到网络。
7.一种用于检索和传送用户通过搜索引擎提交的查询的搜索结果的方法,所述方法包括:
接收查询(402);
将查询解析成一个或多个关键字(404);
在倒排索引中搜索所述一个或多个关键字(406);
对于所述一个或多个关键字中的每一个,标识包括所述一个或多个关键字中的所述每一个的一个或多个网络文档的集合(408);
确定包含所述一个或多个关键字的子集的多个网络文档的集合,其中所述子集等于所述一个或多个关键字的总数(N)减去特定量的关键字(K)(408);以及
传送经过滤的网络文档的集合的列表。
8.如权利要求7所述的方法,其特征在于,在倒排索引中搜索所述一个或多个关键字进一步包括在倒排索引中仅搜索含有N-K个关键字的文档。
9.如权利要求7所述的方法,其特征在于,还包括将所述一个或多个关键字中的至少一个指定为非宽松关键字,其中所述非宽松关键字必须被包含在所述网络文档中。
10.如权利要求7所述的方法,其特征在于,所述网络文档包括所述一个或多个关键字中的全部关键字所述一个或多个关键字中的特定量的关键字。
11.如权利要求10所述的方法,其特征在于,所述一个或多个关键字中的特定量等于2。
12.一种用于检索和传送提交给搜索引擎的查询的结果的计算机设备,包括:
执行计算机可读指令的处理器(104);
用所述计算机可读指令配置的一个或多个计算机可读介质(112);
倒排索引,存储于所述计算机可读介质中并由所述处理器执行,所述倒排索引被配置成接收查询中的所有关键字并标识包含每一个关键字的网络文档(314);以及
宽松过滤设置聚合器,存储于所述计算机可读介质中并由所述处理器执行,用于确定所述倒排索引中包含所述一个或多个关键字的子集的网络文档的列表,其中所述子集等于关键字的总数(N)减去一个关键字(320)。
13.如权利要求12所述的方法,其特征在于,至少一个关键字被指定为要被包含在所述网络文档的每一个中。
14.如权利要求12所述的方法,其特征在于,所述倒排索引维护一个或多个条目,每一个条目包括一关键字和包含该关键字的至少一个文档。
15.如权利要求14所述的方法,其特征在于,所述倒排索引与web爬行器通信,以不断地更新所述一个或多个条目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980149052.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一体化智能加药除臭系统
- 下一篇:带警示功能的消毒柜