[发明专利]一种重复数据删除的方法及装置有效
申请号: | 201410210106.4 | 申请日: | 2014-05-19 |
公开(公告)号: | CN103995863B | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 褚艳旭;裘杰;江云飞 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 镜像文件 指纹 指纹模块 指纹库 重复数据删除 数据块 调用 操作系统类型 虚拟机 操作系统 删除 重复 | ||
1.一种重复数据删除的方法,其特征在于,包括:
根据初始接收的第一镜像文件的数据块所对应的指纹建立指纹库,所述第一镜像文件为初始接收的虚拟机的镜像文件;
将所述指纹库中的所有指纹按照操作系统类型划分为至少一个指纹模块,每个指纹模块对应一种操作系统类型;
接收第二镜像文件,调用与所述第二镜像文件的操作系统类型对应的指纹模块,所述第二镜像文件为在所述初始接收的虚拟机的镜像文件之后接收到的虚拟机的镜像文件;
获取所述第二镜像文件的数据块对应的指纹;
将所述获取的指纹与所述调用出的指纹模块中的指纹一一进行比较,删除与所述调用出的指纹模块中的指纹重复的指纹对应的数据块。
2.根据权利要求1所述的方法,其特征在于,
所述第一镜像文件和所述第二镜像文件均携带类型指示信息,所述类型指示信息用于指示所述第一镜像文件和所述第二镜像文件的操作系统类型以及操作系统的版本类型。
3.根据权利要求2所述的方法,其特征在于,
所述将所述指纹库中的所有指纹按照操作系统类型划分为至少一个指纹模块,具体包括:
根据所述操作系统类型将所述指纹库划分为至少一个指纹模块,将无法识别的操作系统类型的指纹归为公共指纹模块;
按照所述操作系统的版本类型将每个指纹模块划分为至少一个指纹单元。
4.根据权利要求3所述的方法,其特征在于,
所述按照所述操作系统的版本类型将每个指纹模块划分为至少一个指纹单元,具体包括:
若任意两个版本的指纹的重复率大于第一预设值,则合并所述两个版本对应的指纹单元,并删除所述合并的指纹单元中重复的指纹,所述第一预设值是根据CPU的存储空间以及对比较指纹的速度的要求而设定的。
5.根据权利要求3或4任一项所述的方法,其特征在于,
所述接收第二镜像文件,具体包括:
接收所述第二镜像文件,根据所述第二镜像文件携带的所述类型指示信息识别所述第二镜像文件的操作系统类型以及所述操作系统的版本类型;
所述调用与所述第二镜像文件的操作系统类型对应的指纹模块,具体包括:
调用与所述第二镜像文件的操作系统类型对应的指纹模块,在所述调用出的指纹模块中,调出与所述第二镜像文件的版本类型对应的指纹单元。
6.根据权利要求5所述的方法,其特征在于,
所述将所述获取的指纹与所述调用出的指纹模块中的指纹一一进行比较,删除与所述调用出的指纹模块中的指纹重复的指纹对应的数据块,具体包括:
根据所述调用出的指纹模块中与所述第二镜像文件的版本类型对应的指纹单元,创建多个线程将所述获取的指纹与所述指纹单元中的指纹一一进行比较,删除与所述指纹单元中的指纹重复的指纹对应的数据块。
7.根据权利要求6所述的方法,其特征在于,创建所述线程的条件包括以下至少一种:
CPU的使用率小于第二预设值,所述第二预设值是根据操作系统对所述CPU的使用率的需求而设定的;
在所述多个线程将所述获取的指纹与所述指纹单元中的指纹一一进行比较时,所述第二镜像文件中未被比较的数据块的指纹的数量大于第三预设值,所述第三预设值是根据对比较指纹的速度的要求而设定的;
在检测到无线程执行比较的操作时,存在至少一个未被比较的数据块的指纹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410210106.4/1.html,转载请声明来源钻瓜专利网。