[发明专利]数据压缩方法及装置有效
申请号: | 202110513461.9 | 申请日: | 2021-05-11 |
公开(公告)号: | CN113346909B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 王建民;朱妤晴;苏月;安彦哲 | 申请(专利权)人: | 清华大学 |
主分类号: | H03M7/30 | 分类号: | H03M7/30;G06F3/06 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 陈新生 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据压缩 方法 装置 | ||
1.一种数据压缩方法,其特征在于,包括:
获取磁盘的最大存储量、压缩过程数据吞吐及应用负载数据吞吐,并获取单次压缩倍数及免压缩数据量;
基于所述最大存储量、所述压缩过程数据吞吐、所述应用负载数据吞吐、所述单次压缩倍数及所述免压缩数据量获取磁盘占用阈值;实时监测所述磁盘的存储量变化,每当所述磁盘的存储量达到所述磁盘占用阈值时,基于所述单次压缩倍数对免压缩数据之外的存储数据进行压缩;
所述获取单次压缩倍数,具体包括:从压缩倍数取值区间中选取一个值作为所述单次压缩倍数;所述压缩倍数取值区间表示为[rmin,+∞),其中rmin=Vr/(Vr-Vi),rmin表示最小压缩倍数,Vr表示所述压缩过程数据吞吐,Vi表示所述应用负载数据吞吐。
2.根据权利要求1所述的数据压缩方法,其特征在于,所述基于所述最大存储量、所述压缩过程数据吞吐、所述应用负载数据吞吐、所述单次压缩倍数及所述免压缩数据量获取磁盘占用阈值,具体包括:从磁盘占用阈值区间选择一个值作为所述磁盘占用阈值,所述磁盘占用阈值区间表示为(Do,(Du-Do)/(1+1/r+Vi/Vr)+Do],其中Du表示所述最大存储量,Do表示所述免压缩数据量,r表示所述单次压缩倍数。
3.根据权利要求1所述的数据压缩方法,其特征在于,所述免压缩数据为数据产生时间距离当前时间处于预设时间范围内的数据。
4.根据权利要求1所述的数据压缩方法,其特征在于,所述免压缩数据对应的数据产生时间与数据压缩过程中当前时间之间的数据存储量小于或等于所述免压缩数据量。
5.根据权利要求1所述的数据压缩方法,其特征在于,所述基于所述单次压缩倍数对免压缩数据之外的存储数据进行压缩,具体包括:
基于所述单次压缩倍数对免压缩数据之外的存储数据进行整体压缩或分块压缩。
6.根据权利要求5所述的数据压缩方法,其特征在于,在所述基于所述单次压缩倍数对免压缩数据之外的存储数据进行整体压缩或分块压缩之后,所述方法还包括:删除被压缩数据的压缩前数据,并写入压缩后数据。
7.一种数据压缩装置,其特征在于,包括:
获取模块,用于获取磁盘的最大存储量、压缩过程数据吞吐及应用负载数据吞吐,并获取单次压缩倍数及免压缩数据量;
计算模块,用于基于所述最大存储量、所述压缩过程数据吞吐、所述应用负载数据吞吐、所述单次压缩倍数及所述免压缩数据量获取磁盘占用阈值;
压缩模块,用于实时监测所述磁盘的存储量变化,每当所述磁盘的存储量达到所述磁盘占用阈值时,基于所述单次压缩倍数对免压缩数据之外的存储数据进行压缩;
所述获取单次压缩倍数,具体包括:从压缩倍数取值区间中选取一个值作为所述单次压缩倍数;所述压缩倍数取值区间表示为[rmin,+∞),其中rmin=Vr/(Vr-Vi),rmin表示最小压缩倍数,Vr表示所述压缩过程数据吞吐,Vi表示所述应用负载数据吞吐。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述数据压缩方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述数据压缩方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110513461.9/1.html,转载请声明来源钻瓜专利网。