[发明专利]压缩文件创建和解压的方法及装置、以及电子和存储设备有效
申请号: | 201810930100.2 | 申请日: | 2018-08-15 |
公开(公告)号: | CN110888851B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 张峰豪 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/174 | 分类号: | G06F16/174 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;窦晓慧 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 压缩文件 创建 解压 方法 装置 以及 电子 存储 设备 | ||
本申请公开一种压缩文件的创建方法和装置,以及一种压缩文件的解压方法和装置,以及电子设备和存储设备,其中,所述压缩文件的创建方法包括:对源文件进行划分,获得至少两个划分后的源数据段;对划分后的所述源数据段依次进行压缩处理,得到对应所述源数据段的压缩数据段,并记录每个压缩数据段的长度;将所述压缩数据段的长度按照压缩顺序组合为数据映射表;根据所述压缩数据段和所述数据映射表,生成对应于所述源文件的压缩文件。该创建方法能够提高创建压缩文件的高效性、灵活性,且降低内存使用量。
技术领域
本申请涉及计算机应用技术,具体涉及一种压缩文件的创建方法和压缩文件的创建装置,以及一种压缩文件的解压方法和压缩文件的解压装置,以及电子设备和存储设备。
背景技术
传统的分布式块存储采用三副本存储,其存储成本是用户数据量的三倍,在云计算高速发展的今天,成本控制成为企业重要的指标,低成本同样有助于吸引更多的客户占领更多的市场。
存储成本的控制通常情况下是通过对文件进行压缩处理进而减少存储空间,节约存储成本。现有技术中,通常文件压缩方法都是基于“滑动窗口压缩”完成文件压缩,该压缩方法的过程是:当压缩一个文件时,从前往后读取数据的同时进行压缩,后压缩数据对先压缩数据具有一定的依赖性,即:后压缩数据需要根据先前的压缩数据的特点对自身数据进行编码,直到整个文件压缩处理完毕。该种压缩方式存在的缺陷是:
1)灵活性差:文件作为一个压缩整体出现,即在对文件进行压缩处理时,仅能够将所有数据全部压缩,且压缩算法只能选择一种,进而使得压缩方式不灵活;
2)解压性能差:假如一个压缩文件的长度为100MB,当读取第100MB位置的一个字节时,需要将整个文件全部解压,从全部解压文件中查找100MB的字节,进而导致解压性能差;
3)数据可靠性差:同上述2),一个100MB的压缩文件,假如压缩文件仅一个字节损坏或部分内容损坏,该种压缩方式将导致整个压缩文件的解压出现失败,导致无法获得数据。
发明内容
本申请提供一种压缩文件的创建方法,以解决现有技术中压缩方法不灵活的问题。本申请另外提供一种压缩文件的解压方法,以解决现有技术中解压性能和数据可靠性差的问题。
本申请提供一种压缩文件的创建方法,包括:
对源文件进行划分,获得至少两个划分后的源数据段;
对划分后的所述源数据段依次进行压缩处理,得到对应所述源数据段的压缩数据段,并记录每个压缩数据段的长度;
将所述压缩数据段的长度按照压缩顺序组合为数据映射表;
根据所述压缩数据段和所述数据映射表,生成对应于所述源文件的压缩文件。
在一些实施例中,还包括:创建用于描述压缩数据段属性信息的压缩数据段头部;
所述将压缩数据段的长度按照压缩顺序组合为数据映射表包括:
计算压缩数据段与压缩数据段头部的长度和,将所述长度和按照压缩顺序组合为数据映射表;
所述根据所述压缩数据段和所述数据映射表,生成对应于所述源文件的压缩文件,包括:
根据所述压缩数据段头部、所述压缩数据段以及所述数据映射表,生成对应于所述源文件的压缩文件。
在一些实施例中,所述压缩数据段属性信息包括至少如下一种信息:所述压缩数据段头部的校验值,所述压缩数据段对应的压缩算法的信息,所述压缩数据段中的压缩数据的校验值,所述压缩数据段的长度,所述压缩数据段格式的识别信息,所述压缩数据段的版本信息。
在一些实施例中,所述根据所述压缩数据段头部、压缩数据段以及所述数据映射表,生成对应于所述源文件的压缩文件,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810930100.2/2.html,转载请声明来源钻瓜专利网。