[发明专利]索引文档以供信息检索有效
| 申请号: | 200780020322.0 | 申请日: | 2007-03-15 |
| 公开(公告)号: | CN101460949A | 公开(公告)日: | 2009-06-17 |
| 发明(设计)人: | M·J·泰勒;S·罗伯逊;H·E·威廉姆斯;N·E·克拉斯韦尔 | 申请(专利权)人: | 微软公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/21 |
| 代理公司: | 上海专利商标事务所有限公司 | 代理人: | 陈 斌 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 诸如web搜索系统等信息检索系统在查询项的基础上在数百万甚至数十亿可能的文档中定位文档。为实现这点,创建了文档索引。建议在文档中创建新的字段以存储反馈信息。该信息包括在特定搜索中所使用的查询项以及关于是否对所检索到的特定文档给予例如肯定反馈或否定反馈的信息。在该反馈信息加上其它可用信息的基础上创建索引。结果,改进了搜索结果的相关性。对给定文档有多个信息字段(如摘要字段、标题字段、锚文本字段以及此处的反馈字段可用。使用了处理多个字段以及多个查询项并提供对文档字段的差异加权的任何搜索算法。 | ||
| 搜索关键词: | 索引 文档 信息 检索 | ||
【主权项】:
1. 一种形成供在信息检索系统中使用的文档索引的方法,所述方法包括以下步骤:(i)指定多个字段,包括可以联合每一文档使用的至少一个反馈字段;(ii)访问多个文档,且对于那些文档的每一个,使用来自所访问的文档的信息填充至少某些字段;(iii)接收包括多个查询项、所述文档中特定一个文档哪个的标识符、和关于反馈的类型的信息的反馈信息;(iv)对于所述文档中所述特定一个文档,在关于所述反馈类型的信息的基础上用所述多个查询项来填充反馈字段;(v)在所填充的字段是基础上形成所述文档的索引;(vi)接收多个查询项;(vii)在所述多个查询项的基础上从所述索引中获得文档统计数据,并使用搜索算法来生成经排序的文档列表,所述搜索算法适于与多个查询项和多个文档字段一起使用并被安排成提供对所述字段的差异加权。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200780020322.0/,转载请声明来源钻瓜专利网。
- 上一篇:双推尾撑定柱复位式液压狭缝推进器
- 下一篇:感应式汽车电子油门
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





