[发明专利]一种基于特征识别的混合无损压缩方法及装置有效
申请号: | 201710710582.6 | 申请日: | 2017-08-17 |
公开(公告)号: | CN107565970B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 刘同强;周玉龙;童元满;赵元;邹晓峰 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | H03M7/30 | 分类号: | H03M7/30;H03M7/40 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 张亮 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 识别 混合 无损 压缩 方法 装置 | ||
1.一种基于特征识别的混合无损压缩方法,其特征在于,包括如下步骤:
读取文件并对读取的文件预分析进行区域划分;具体包括:顺序读取文件,读取过程中记录每段连续超过Y个相同字节的分布区域;每个区域通过起始地址与长度标记;
读取完毕得到文件区域数据,此时文件扩展为文件区域数据与文件原始数据的组合文件;文件区域数据存放在组合文件的开始部分;
对划分的每个非连续字符区域进行各个字符的频率计算统计;
根据频率的方差值的大小选择不同的算法编码;确定压缩算法的同时,修改文件区域数据,输出压缩文件。
2.根据权利要求1所述的一种基于特征识别的混合无损压缩方法,其特征在于,对划分的每个非连续字符区域进行各个字符的频率计算统计,具体实现包括;
记录每个非连续字符区域总字符数为N;
频率的平均值为M=1/N;
本区域的频率方差:x0-x(N-1)表示每个字符出现的频率。
3.根据权利要求2所述的一种基于特征识别的混合无损压缩方法,其特征在于,根据频率的方差值的大小选择不同的算法编码;确定压缩算法的同时,修改文件区域数据,具体包括:
若S的取值大于设定阈值,选择霍夫曼编码,否则选择LZ77编码;确定压缩算法的同时在每个区域标记之后添加压缩算法标志,组成编码标识,所述编码标识使用一个字节表示。
4.根据权利要求1所述的一种基于特征识别的混合无损压缩方法,其特征在于,步骤对划分的每个非连续字符区域进行各个字符的频率计算统计还包括:对连续字符区域,不进行字符频率统计,直接选用RLE编码。
5.根据权利要求3或4所述的一种基于特征识别的混合无损压缩方法,其特征在于,该方法还包括数据解压缩,数据解压缩过程具体包括:读取压缩文件的编码标识,根据编码标识选择对应的解压算法输出到需解压文件,完成压缩文件的解压。
6.一种基于特征识别的混合无损压缩装置,其特征在于,包括文件处理模块和判断模块;
文件处理模块读取文件并对读取的文件分析进行区域划分;
所述文件处理模块包括计算单元,计算单元对划分的每个非连续字符区域各个字符进行频率的计算统计;
判断模块根据计算单元输出的频率的方差值的大小选择不同的算法编码;同时文件处理模块修改文件区域数据,文件处理模块还包括控制单元,控制单元控制编码模块对对应的区域字符进行编码,输出压缩数据流文件到存储模块;
该装置还包括计数模块,所述计数模块与所述文件处理模块连接;
文件处理模块顺序读取文件过程中计数模块对读取过程中每个字节进行计数并记录每段连续超过Y个相同字节的分布区域;每个区域通过起始地址与长度标记,文件处理模块根据计数模块对不同字节的计数值对文件进行区域划分。
7.根据权利要求6所述的一种基于特征识别的混合无损压缩装置,其特征在于,所述计算单元与计数模块连接,计算单元根据计数模块对每个非连续字符区域各个字符的计数值进行各个字符的频率计算统计。
8.根据权利要求7所述的一种基于特征识别的混合无损压缩装置,其特征在于,文件处理模块读取存储模块中压缩文件的编码标识,根据编码标识选择对应的解压算法输出到需解压文件,控制单元控制解压模块完成压缩文件的解压。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710710582.6/1.html,转载请声明来源钻瓜专利网。