[发明专利]基于Huffman编码的LZW数据压缩方法及系统有效
| 申请号: | 201910646589.5 | 申请日: | 2019-07-17 |
| 公开(公告)号: | CN110518917B | 公开(公告)日: | 2023-01-03 |
| 发明(设计)人: | 张楠;李宁波;佘平;冯馨锐;赫凌俊 | 申请(专利权)人: | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) |
| 主分类号: | H03M7/40 | 分类号: | H03M7/40;H03M7/30 |
| 代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
| 地址: | 201800 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 huffman 编码 lzw 数据压缩 方法 系统 | ||
本发明提供了一种基于Huffman编码的LZW数据压缩方法及系统,包括:编码步骤:对原始数据进行Huffman编码,得到只有0和1组成的字符串;压缩步骤:根据预设的压缩比构造索引表,然后根据索引表对得到的字符串进行LZW压缩;一次解码步骤:根据索引表对编码文件进行解码操作,得到字符串;二次解码步骤:根据Huffman编码表对得到的字符串进行解码,得到原始数据。在保证压缩效率的前提下,提高了压缩率。
技术领域
本发明涉及数据处理领域,具体地,涉及一种基于Huffman编码的LZW数据压缩方法及系统。
背景技术
随着信息技术的发展,各行各业开始向信息化转型,各个系统平台对数据的存储和传输提出了更高的要求。数据量的上升,分布式技术的发展,以及各种冗余技术的使用使得存储系统的压力越来越大,如果不做处理,存储系统就会存在溢出的风险。同时,信息化的进程使得数据的传输更加的频繁,受到网络环境限制,传输的数据量和任务失败率成正比关系;很多系统对数据的实时性要求很高,因此对数据的传输延迟提出了更高的要求。数据压缩是指在不丢失有用信息的前提下减少数据量,以减少存储空间,提高传输和处理的效率。适当的压缩数据对解决数据存储和数据传输意义重大。
数据压缩可以被分为有损压缩和无损压缩。无损压缩利用了现实世界中数据的统计冗余特性,可以更加简练、完整的传输数据。有损压缩通常应用在视频和音频数据的传输中,利用人的眼睛和耳朵无法分辨出视频和音频中细微的差别使用较少的位数表示图像、视频或者音频。常用的压缩算法主要有Lempel-Ziv,Huffman, LZW等。Lempel-Ziv算法通过对一个由0、1组成的预先串另加一个新的比特进行编码,来实现对比特序列的压缩。通过一个字典存储压缩过程中出现的比特串,当对一个新的短语编码时,指明已有短语在字典中的位置,并附加新字母。Lempel-Ziv 算法多用于比特编码压缩时,而且实现复杂,算法复杂度较高。Huffman算法利用了各个短语在文档中出现的频率信息,频率越高采用越的短编码串,频率越低使用的编码串越长,这样来有效的进行编码的组织。虽然Huffman的压缩率只有40%左右,但是它可以将整个文档转化为只有0和1表示的格式,为后续的处理提供了方便。LZW算法是通过建立一个字符串表,用较短的代码来表示较长的字符串,从而实现压缩的。LZW算法中的字符串和编码的对应关系是动态生成的,从原始的文档中提取出字符串,将其转化成较短的索引,并用索引表示文档中出现的相应字符串。由此可见,如果原始文档中的数据元素相对所较少,为字符串提取阶段可以被大大的简化。
公开号CN109614043A的专利公开了一种数据压缩方法、装置、系统及计算机可读存储介质,利用预设事件计算主机与存储介质的负载情况,进行对比后选择负载较低的设备作为数据压缩的主体设备,从而来提高数据压缩的效率。原理是检索到可以提供较大计算能力的设备,加快压缩速度,其本质上对于数据压缩算法的效率和压缩比率并没有任何的改变与提高,而且数据压缩的预设事件往往也很难检测到。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于Huffman编码的LZW数据压缩方法及系统。
根据本发明提供的一种基于Huffman编码的LZW数据压缩方法,包括:
编码步骤:对原始数据进行Huffman编码,得到只有0和1组成的字符串;
压缩步骤:根据预设的压缩比构造索引表,然后根据索引表对得到的字符串进行LZW 压缩;
一次解码步骤:根据索引表对编码文件进行解码操作,得到字符串;
二次解码步骤:根据Huffman编码表对得到的字符串进行解码,得到原始数据。
优选地,所述编码步骤包括:
统计原始数据中各个字符出现的频率,根据频率构造Huffman树;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东计算技术研究所(中国电子科技集团公司第三十二研究所),未经华东计算技术研究所(中国电子科技集团公司第三十二研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910646589.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于Fréchet距离的轨迹数据压缩方法
- 下一篇:译码方法及译码器





