[发明专利]索引文档以供信息检索有效

专利信息
申请号: 200780020322.0 申请日: 2007-03-15
公开(公告)号: CN101460949A 公开(公告)日: 2009-06-17
发明(设计)人: M·J·泰勒;S·罗伯逊;H·E·威廉姆斯;N·E·克拉斯韦尔 申请(专利权)人: 微软公司
主分类号: G06F17/30 分类号: G06F17/30;G06F17/21
代理公司: 上海专利商标事务所有限公司 代理人: 陈 斌
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要: 诸如web搜索系统等信息检索系统在查询项的基础上在数百万甚至数十亿可能的文档中定位文档。为实现这点,创建了文档索引。建议在文档中创建新的字段以存储反馈信息。该信息包括在特定搜索中所使用的查询项以及关于是否对所检索到的特定文档给予例如肯定反馈或否定反馈的信息。在该反馈信息加上其它可用信息的基础上创建索引。结果,改进了搜索结果的相关性。对给定文档有多个信息字段(如摘要字段、标题字段、锚文本字段以及此处的反馈字段可用。使用了处理多个字段以及多个查询项并提供对文档字段的差异加权的任何搜索算法。
搜索关键词: 索引 文档 信息 检索
【主权项】:
1. 一种形成供在信息检索系统中使用的文档索引的方法,所述方法包括以下步骤:(i)指定多个字段,包括可以联合每一文档使用的至少一个反馈字段;(ii)访问多个文档,且对于那些文档的每一个,使用来自所访问的文档的信息填充至少某些字段;(iii)接收包括多个查询项、所述文档中特定一个文档哪个的标识符、和关于反馈的类型的信息的反馈信息;(iv)对于所述文档中所述特定一个文档,在关于所述反馈类型的信息的基础上用所述多个查询项来填充反馈字段;(v)在所填充的字段是基础上形成所述文档的索引;(vi)接收多个查询项;(vii)在所述多个查询项的基础上从所述索引中获得文档统计数据,并使用搜索算法来生成经排序的文档列表,所述搜索算法适于与多个查询项和多个文档字段一起使用并被安排成提供对所述字段的差异加权。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200780020322.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top