[发明专利]一种基于部分霍夫曼树的数据压缩编码方法有效

专利信息
申请号: 201310294301.5 申请日: 2013-07-12
公开(公告)号: CN104283568B 公开(公告)日: 2017-05-17
发明(设计)人: 台玉朋;王海斌;汪俊;杨晓霞 申请(专利权)人: 中国科学院声学研究所
主分类号: H03M7/40 分类号: H03M7/40
代理公司: 北京方安思达知识产权代理有限公司11472 代理人: 王宇杨,李彪
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 部分 霍夫曼树 数据压缩 编码 方法
【说明书】:

技术领域

发明涉及数据压缩领域,更具体地涉及一种基于部分霍夫曼树的数据压缩编码方法,以通过构建部分霍夫曼树实现快速数据压缩编码的方法。

背景技术

随着计算机和网络技术的蓬勃发展,整个网络的数据量正呈指数型增长。虽然计算机的处理速度、硬盘容量以及网络带宽也有了巨大的进步,但仍难以适应数据增长的速度。如何将数据压缩的更小,压缩的更快一直以来都是人们积极研究的方向。

熵编码是数据压缩的一种重要方式。简单地说,熵编码的内涵就是对一段数据中出现概率高的字符用较短的码字代替,相应的较少出现的字符则用相对长的码字代替,这样就达到了对数据压缩的目的,所以熵编码可以看作是一个分配码字的过程。在由q个字符组成的字符集{a1,a2,…,aq}中,字符ai(i=1,2,…,q)发生的概率为pi,分配给它的编码长度为Li,最优编码便是指平均编码长度:

公式1

为最小的一种编码方案。

霍夫曼编码算法正是一种十分经典且有效的最优编码方法。具体来说,霍夫曼编码过程可以分为概率统计-生成编码表-编码三个步骤:即首先统计待编码数据中各个字符以及它们的出现概率;然后,依照每个字符出现概率的大小,应用霍夫曼编码算法为它们分配不同的码字,生成编码表;最后,对照编码表将原字符替换成相应的码字,即完成了对数据的编码。

在霍夫曼编码算法中,生成编码表是其算法的核心。编码表是一个待编码字符集{a1,a2,...,aq}与其码字集{s1,s2,...,sq}之间的映射关系表。在经典的霍夫曼编码方法中,主要依靠构建霍夫曼树来生成编码表。

霍夫曼树是一种典型的二叉树,在二叉树中节点由线段相互连接,这些线段叫做“枝”,处于“枝”上方的节点称为“父”,处在下方的节点称为“子”,处在整个树最上端的没有“父”的节点称为“根”,处在最下方的没有“子”的称为“叶子”。处在父节点右下方的所有子节点构成该节点的右子树,左下方的构成左子树。从根节点到达各个节点所经过的节点数称为该节点的路径长度,拥有相同路径长度的节点组成一个层。

现有的构建一棵霍夫曼树并生成编码表的主要步骤如下:

1)根据待编码字符集{a1,a2,...,aq}以及它们的概率{p1,p2,...,pq}构造二叉树集F:{T1,T2,...,Tq},其中,树Ti中仅有一个带权的根节点,且其概率等于相应字符ai的概率。

2)在树集F中找到两棵根节点概率最小的树,以它们作为左右子树构造一棵新的二叉树,新二叉树根节点的概率是其左右子树根节点概率的和。

3)在F中删除这两棵树,并将新的二叉树加入F。

4)重复步骤2)和3)直至F中仅剩一棵树为止,这棵树便是霍夫曼树。

5)自顶向下遍历整棵树,输出编码表。

这种经典的霍夫曼编码方法存在以下两个问题:

1)这种方法每次的递推过程都要进行大量的排序操作,在最终的霍夫曼树中所有节点都是按照顺序依次排列的,这种排列需要以大量的比较运算作为支撑,影响了整个算法的效率。

2)这种经典霍夫曼编码方法必须构建完整的霍夫曼树才能编码,理论研究表明,霍夫曼树中层间节点的关系以及层内节点的排序对于生成编码表并没有贡献。只要采用某种方法将待编码字符存入相应的层,即可实现最优编码。

发明内容

本发明的目的在于,提供一种部分霍夫曼树的构建方法及其快速数据压缩编码方法,该方法为仅构建霍夫曼树的一部分就能生成编码表的新方法,简言之,首先通过较为粗略但计算十分简便的方法为所有需编码的字符预先分配一个编码长度,从而构成一个分层的编码表称为预编码表;然后以预编码表为基础对霍夫曼树中一些特定部分进行构建;在构建部分霍夫曼树的同时,动态的调整字符的层序,实现对预编码表的修改,直到其满足了最优编码表的条件为止。这样不用构建一个完整的霍夫曼树,就能获得与经典霍夫曼算法同样的编码效果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310294301.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top