[发明专利]一种计算机数据压缩方法及装置有效
申请号: | 201210022423.4 | 申请日: | 2012-02-01 |
公开(公告)号: | CN102594360A | 公开(公告)日: | 2012-07-18 |
发明(设计)人: | 王旭;刘正伟 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | H03M7/30 | 分类号: | H03M7/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 栗若木;曲鹏 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算机 数据压缩 方法 装置 | ||
技术领域
本发明涉及计算机应用技术,尤其涉及计算机数据压缩的优化方法及装置。
背景技术
数据压缩是将数据重新组织为一种可还原的格式,依这种格式处理的数据所占用的空间大小要远远小于原始数据的空间大小。在计算机应用领域中,数据压缩可以减小存储空间,可以降低传输代宽,减少输入输出(IO)读写次数等,具有诸多积极意义。衡量一个数据压缩算法的好坏无外乎是看其压缩比和压缩效率。
由于不同的压缩算法的设计着眼点不同,每个压缩算法在不同的场景下,压缩比都是不同的。有的压缩算法(如zlib)对文本的压缩能力很强,但对二进制文件的压缩效果却不尽如人意;有的压缩算法(如lzw)对二进制文件的压缩能力很强,但对其它文件的压缩能力却不是很理想。因此,需要提供一种机制,能够根据待压缩数据本身的特点选择最合适的压缩算法,以便让每种压缩算法都充分发挥其最大的功效,这将具有十分重要的意义。
隐马尔可夫模型(HMM,Hidden Markov Model)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程,然后利用这些参数作进一步分析,例如模式识别。其难点是从可观察的参数中确定该过程的隐含参数。在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息。目前,隐马尔可夫模型在语音识别上有着非常积极的应用。
在生物信息学的遗传算法中,有一个概念叫做基因突变,是指在进行染色体杂交的时候,某个染色体的某个成员会以一定的概率变为染色体成员中的其它成员。这种突变保证了生物遗传最优结果集的产生。
如果能够采用隐马尔可夫模型来选取数据压缩算法,同时附加将突变概念运用到数据压缩算法最优结果的产生上,将会使压缩算法的选取更平均,取得更好的压缩效果。
发明内容
本发明所要解决的技术问题是提供一种计算机数据压缩方法及装置,能够优化整体的压缩效率。
为了解决上述技术问题,本发明提供了一种计算机数据压缩方法,包括:
根据待压缩数据的类型从备选的压缩算法集内自适应地选择相应的压缩算法压缩数据。
进一步地,在执行根据待压缩数据的类型选择相应的压缩算法压缩数据之前,还包括:
判断待压缩数据是否需要采用突变的压缩算法来压缩,是则选择突变算法压缩数据;否则,
执行根据待压缩数据的类型从备选的压缩算法集内自适应地选择相应的压缩算法压缩数据。
进一步地,判断待压缩数据是否需要采用突变的压缩算法来压缩,是则选择突变算法压缩数据,具体包括:
将生成的一个随机数与指定的概率阀值进行比较,如果生成的随机数大于所述概率阀值,则从压缩算法集中任意选择一个压缩算法压缩数据。
进一步地,根据待压缩数据的类型从备选的压缩算法集内自适应地选择相应的压缩算法压缩数据,具体包括:
第一步:采用采用隐马尔可夫模型的如下公式计算每一压缩算法的选取概率:
式中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210022423.4/2.html,转载请声明来源钻瓜专利网。