[发明专利]文件列表生成方法、系统以及程序、文件列表生成装置有效

专利信息
申请号: 201310045913.0 申请日: 2013-02-05
公开(公告)号: CN103257993A 公开(公告)日: 2013-08-21
发明(设计)人: 西田晋平;今井敬 申请(专利权)人: 株式会社日立解决方案
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京银龙知识产权代理有限公司 11243 代理人: 许静;郭凤麟
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文件 列表 生成 方法 系统 以及 程序 装置
【说明书】:

技术领域

本发明涉及一种高效地对文件服务器内保存的大量文件数据的阶层进行分析,高效地生成应该更新检索索引的文件列表的方法、系统以及程序和装置,特别涉及针对已经存在的配置在依照共同的命名规则生成的2个目录下的文件组比较文件树来高效地生成进行了追加、变更、删除的文件数据的一览的方法和系统以及程序、装置。 

背景技术

近年来,随着计算机性能的高速化、HDD的大容量化,能够制作巨大数量的非典型文档。因此,从巨大数量的文档中高速并且正确地找出需要的文档的检索系统的必要性不断提高。为了使检索结果正确,重要的是针对存储有成为检索对象的非典型文档的文件服务器,实时地在检索索引中反映在生成检索索引后进行的文件数据的追加、变更、删除操作。在向检索索引反映这些时,当对于没有变更的文件数据也更新检索索引时,会花费大量时间,因此,一般仅针对具有追加、变更、删除的文件数据,更新检索索引。为此,需要生成进行了追加、变更、删除的文件数据的一览。 

为了应对这样的检索系统的需求,存在具备以下接口的技术,该接口将文件数据的操作履历存储在文件服务器中,根据来自外部的要求提供进行了追加、变更、删除的文件数据的一览。或者,为了能够访问某个过去的状态的文件树,还存在提供一种接口的技术,该接口将某时刻的文件数据状态作为“快照”保存在其他目录中。 

另外,作为这种现有技术,已知在下述的专利文献1中公开的技术。 

专利文献1:日本特开2006-268456号 

发明内容

在生成进行了追加、变更、删除的文件数据的一览时,在文件服务器提供了一览的情况下,可以利用该接口,但在不具备这样的接口的文件服务器的情况下,需要对文件服务器内存在的检索索引生成对象范围的全部文件数据进行 扫描,确定有无更新操作。 

在此,在进行了追加、变更、删除的文件数据较少的情况下,也需要对全部文件数据进行扫描,因此,进行了追加、变更、删除的文件数据的一览的生成处理成为索引更新处理的时间变长的主要原因。 

对此,考虑通过将文件服务器内的文件树构造分割为几个,并行地进行针对这些文件树的扫描处理,由此提高扫描处理的速度。 

但是,由于文件服务器内的文件树由于环境的不同而各种各样,是未知的,所以难以确定有效的分割方法。对于已经一次生成了索引的文件服务器,通过使自身系统内具有索引已生成文件一览,能够高速地生成进行了追加、变更、删除的文件数据的一览。但是,在索引已生成文件一览中,为了判别是否对文件进行了更新,需要存储文件数据的哈希值,因此,产生为了存储索引已生成文件一览系统自身需要大容量的存储盘,系统规模与检索对象的文件数的增加成正比地变大。 

本发明的目的在于提供一种文件列表生成方法、系统、程序和装置,其在自身系统中无需具有包含文件数据的哈希值的索引已生成文件一览,能够高速地生成进行了追加、变更、删除的文件数据的一览,高速地进行检索索引更新处理。 

为了达到上述目的,本发明的文件列表生成方法的特征为包括:将针对检索对象文件已经生成的索引信息存储在第一存储单元中的步骤;从上述第一存储单元中存储的索引信息中,取得检索对象文件的目录URL,对该目录URL进行分析来对各阶层的目录数进行累计,根据该累计结果,决定通过分散服务器组分割地进行扫描对象目录的扫描处理的分割方针的步骤;依照所决定的分割方针,对检索对象文件的目录进行分割的步骤;取得扫描对象文件的当前目录树的快照并存储在第二存储单元中的步骤;对于上述当前目录树的快照和在决定上述分割方针之前取得并存储在第三存储单元中的检索对象文件的目录树的快照,按照在决定上述分割方针的步骤中所决定的分割后的单位,通过上述分散服务器组对各目录上的检索对象文件进行分散扫描的步骤;以及对该分散扫描结果进行比较,生成并输出在生成上述索引信息后进行了追加、删除、变更的文件的一览的步骤。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立解决方案,未经株式会社日立解决方案许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310045913.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top