[发明专利]用于对内容进行离线索引和对存储的数据进行分类的方法和系统有效
| 申请号: | 200780038686.1 | 申请日: | 2007-10-17 |
| 公开(公告)号: | CN101529419A | 公开(公告)日: | 2009-09-09 |
| 发明(设计)人: | P·戈卡莱;R·科托姆塔拉耶尔;D·R·阿塔尔德;安俊玄;A·普拉拉德;J·A·施瓦茨;D·恩戈;B·布罗克韦;M·S·穆勒 | 申请(专利权)人: | 慷孚系统公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/40 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 李向英 |
| 地址: | 美国*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 内容 进行 离线 索引 存储 数据 分类 方法 系统 | ||
对相关申请的交叉引用
本申请要求2006年10月17日提出的标题为 “METHOD AND SYSTEM FOR COLLABORATIVE SEARCHING” 的美国临时申请案No.60/852,584(代理记过档案号码 60692-8047.US00)的优先权,这里引用了该申请的全部内容作为参考。
背景技术
计算机系统包含大量的数据。此数据包括个人数据,如 财务数据、消费者/客户/病人联系数据,音频/视频数据等等。公司的 计算机系统常常包含文字处理文档、工程图形、电子表格、经营策略 演示文稿等等。随着计算机系统的流行,创建内容越来越容易,一个 机构的内容量快速地扩大。甚至小的单位所存储的信息也比任何单个 雇员所能了解或查找的多得多。
许多机构安装了内容管理软件,该软件积极地搜索机构 内的文件,并创建每一个文件中的可用的信息的索引,该索引可以用 于基于主题来搜索和检索文档。这样的内容管理软件一般维护了内容 内发现的关键字的索引,如文档中的单词。
要创建内容索引,一般需要访问一个机构内的所有计算 机系统,并会向已经负担很重的系统上施加出乎意料的负载。某些机 构推迟进行内容索引,直到非高峰时间,如大清早,以降低对系统的 可用性的影响。然而,其他操作在非高峰时间可能会争夺系统资源。 例如,系统备份一般也预定在非高峰时间进行。在正在进行备份时(叫 做“备份窗口”),系统可能处于不可用状态,以防止数据被修改。对 于具有大量的数据的机构,任何中断,如内容索引所产生的中断,都 会危害在备份窗口内完成备份的能力。
此外,传统的内容索引只标识在机构内当前可用的信息, 并不足以发现机构所需的所有数据。例如,可以要求一个机构响应法 律发现请求,产生过去某一时段内存在的文件。可能需要五年前的电 子邮件或已经删除或不再可用(除非在现场以外的备份磁带中)的文 件,来响应这样的请求。一个机构可以有义务执行检索全部此内容的 费时的任务,并执行与请求相关的内容的手动搜索。
需要一种克服了上面的问题,并能提供额外的好处的系 统。
附图说明
图1是显示了本发明的一个实施例中的系统的组件的 方框图。
图2是显示了一个实施例中的流过系统的数据流的方 框图。
图3是显示了一个实施例中的系统的内容索引组件的 处理的流程图。
图4是显示了一个实施例中的系统的索引搜索组件的 处理的流程图。
图5显示了一个实施例中的包含内容索引的条目的数 据结构。
在图形中,为便于理解和方便,相同的附图标记和缩写 词标识具有相同或类似功能的元件或操作。为轻松地标识任何特定元 件或操作的讨论,附图标记中的最高有效位是指该元件首次被介绍时 的图号(例如,元件1104是在图11中首次被介绍和讨论的)。
这里所提供的标题只是为了方便,不一定影响带有权利 要求的发明的范围或含义。
具体实施方式
概述
提供了用于创建内容的索引而不会干涉内容的源的方法 和系统包括,离线内容索引系统,用于从数据的离线副本创建内容的 索引。一般而言,机构可以具有源数据的主要或生产副本和数据的一 个或多个离线或辅助副本。可以使用各种存储操作,如快照、备份、 复制、迁移及其他操作,创建辅助副本。离线内容索引系统可以通过 检查机构的数据的辅助副本(例如,从由机构执行的例行的备份生成 的备份文件),创建机构的内容的索引。离线内容索引系统能够从系 统的当前辅助副本以及包含机构的网络上不再可用的数据较旧的离 线副本,对内容进行索引。例如,机构可以具有几年前的辅助副本, 其包含不再可轻松地获得但仍可能与机构相关的较旧的数据。离线内 容索引系统可以将叫做元数据的非内容的传统索引的一部分的额外 的属性,如内容最后可用的时间或与内容关联的用户属性,与数据关 联。例如,可以存储数据文件与其关联的诸如项目名称之类的用户属 性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慷孚系统公司,未经慷孚系统公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780038686.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:现场可编程门阵列(FPGA)的容错系统内编程
- 下一篇:消息传送模型和架构
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





