[发明专利]一种存储系统检索文件内容的方法和设备在审
申请号: | 202110354363.5 | 申请日: | 2021-04-01 |
公开(公告)号: | CN113127421A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 王勇 | 申请(专利权)人: | 山东英信计算机技术有限公司 |
主分类号: | G06F16/14 | 分类号: | G06F16/14;G06F16/13;G06F16/174 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰;宋薇薇 |
地址: | 250101 山东省济南市高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 存储系统 检索 文件 内容 方法 设备 | ||
本发明提供了一种存储系统检索文件内容的方法和设备,该方法包括:将存储系统中的每个文件内容按照预设大小划分成多个部分;计算每个部分的Hash值,并将计算得到的Hash值在存储系统中进行匹配;响应于存储系统中没有匹配到与计算得到的Hash值相同的Hash值,将计算得到的Hash值保存到存储系统中;基于文件内容和计算得到的Hash值建立文件Hash值链表;响应于接收到检索文件的指令,计算每个检索词的Hash值并将每个检索词的Hash值在文件Hash值链表中进行匹配以检索文件。通过使用本发明的方案,能够节省数据的存储空间,提高文件的检索效率,提高产品竞争力。
技术领域
本领域涉及计算机领域,并且更具体地涉及一种存储系统检索文件内容的方法和设备。
背景技术
在云计算时代,海量数据的产生即需要大容量的存储空间,也需要在海量的数据中快速的检索所目标文件内容。传统的文件检索采用目录树的方式,将文件的大小、时间信息甚至文件本身的结构化信息存入文件的元数据区域。这种方式可以很好的进行文件的文件名检索和文件内容特定关键信息的检索,但随着目录树的层数加深,文件的检索效率也将大大折扣,而且也不能对整个文件内容进行检索,也存在重复内容的文件占用存储空间的问题。
发明内容
有鉴于此,本发明实施例的目的在于提出一种存储系统检索文件内容的方法和设备,通过使用本发明的技术方案,能够节省数据的存储空间,提高文件的检索效率,提高产品竞争力。
基于上述目的,本发明的实施例的一个方面提供了一种存储系统检索文件内容的方法,包括以下步骤:
将存储系统中的每个文件内容按照预设大小划分成多个部分;
计算每个部分的Hash值,并将计算得到的Hash值在存储系统中进行匹配;
响应于存储系统中没有匹配到与计算得到的Hash值相同的Hash值,将计算得到的Hash值保存到存储系统中;
基于文件内容和计算得到的Hash值建立文件Hash值链表;
响应于接收到检索文件的指令,计算每个检索词的Hash值并将每个检索词的Hash值在文件Hash值链表中进行匹配以检索文件。
根据本发明的一个实施例,还包括:
记录每个部分在文件中的顺序。
根据本发明的一个实施例,基于文件内容和计算得到的Hash值建立文件Hash值链表包括:
将文件中的每个部分的Hash值按照顺序进行排列;
建立每个部分的Hash值与每个部分的文件内容的对应关系。
根据本发明的一个实施例,响应于接收到检索文件的指令,计算每个检索词的Hash值并将每个检索词的Hash值在文件Hash值链表中进行匹配以检索文件包括:
将检索词的Hash值中的第一个在所有的文件Hash值链表中进行匹配;
响应于第一个检索词的Hash值在文件Hash值链表中存在,返回第一个检索词的Hash值对应的文件名称;
将检索词的Hash值中的第二个在返回的文件名称的文件Hash值链表中进行匹配;
响应于第二个检索词的Hash值在文件Hash值链表中存在,返回第二个检索词的Hash值对应的文件名称;
继续依次匹配其他关键词的Hash值直到检索到目标文件。
根据本发明的一个实施例,还包括:
将计算得到的Hash值通过Base58进行编码。
本发明的实施例的另一个方面,还提供了一种存储系统检索文件内容的设备,设备包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东英信计算机技术有限公司,未经山东英信计算机技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110354363.5/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法