[发明专利]一种基于多层排重的虚机快照备份方法和系统有效
申请号: | 201210291388.6 | 申请日: | 2012-08-15 |
公开(公告)号: | CN103593256B | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | 张为;唐洪;蒋灏;曾月;李小刚 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 北京国昊天诚知识产权代理有限公司11315 | 代理人: | 许志勇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 快照 备份 方法 系统 | ||
1.一种基于多层排重的虚机快照备份方法,包括:
将虚机快照划分为多个子数据块,将每个子数据块划分为多个数据片段;
对所述虚机快照进行多层排重,以排除所述虚机快照中会导致重复备份的数据;以及
存储经多层排重处理后剩余的虚机快照数据;
其中,对所述虚机快照进行多层排重包括:对所述虚机快照划分成的子数据块进行子数据块排重、对子数据块划分成的数据片段进行数据片段排重,所述数据片段排重包括:判断经所述子数据块排重后剩余的子数据块中的多个数据片段自上次备份以来是否改变;排除被确定为未改变的数据片段;保留被确定为已改变的数据片段。
2.根据权利要求1所述的方法,其中,对所述虚机快照进行多层排重还包括:公用数据集排重,其中,所述公用数据集中存储备份存储文件系统中重复率高于预定阈值的数据片段。
3.根据权利要求1所述的方法,其中,所述子数据块排重包括:
判断所述多个子数据块自上次备份以来是否改变;排除被确定为未改变的子数据块;保留被确定为已改变的子数据块。
4.根据权利要求2所述的方法,其中,所述公用数据集排重包括:
将经所述数据片段排重后剩余的所述已改变的数据片段的数据特征与所述公用数据集中数据的数据特征进行比较,判断所述已改变的数据片段是否存在于所述公用数据集中,排除被确定存在于所述公用数据集中的数据片段。
5.根据权利要求1-4任一项所述的方法,其中,将每个子数据块划分为多个数据片段的步骤包括:
基于数据内容特征,将每个子数据块切割成多个变长的数据片段。
6.根据权利要求1-4任一项所述的方法,其中,所述虚机快照包括子数据块的数据指纹、大小和数据指针;所述子数据块包括数据片段的数据指纹、大小和数据指针。
7.根据权利要求2或4所述的方法,还包括:
对备份存储文件系统进行定期扫描,根据数据存储中的数据重复特征,抽取重复率高于特定阈值的数据并将其存入所述公用数据集。
8.根据权利要求1-4任一项所述的方法,还包括:
对于经由所述多层排重所排除的数据,在虚机快照备份中直接引用虚机前一快照中的对应数据的索引。
9.根据权利要求1-4任一项所述的方法,还包括:
执行快照回滚,其包括:从备份存储文件系统中按照虚机待回滚的快照的索引读出子数据块的索引,按照子数据块的索引读出数据片段,将读出的数据片段组装成子数据块,将组装成的子数据块组装成待回滚的快照,其中,通过结合当前虚机镜像文件的修改信息和待回滚快照的索引信息,确定当前虚机镜像文件和待回滚快照中的共有数据,所述共有数据不用从备份存储文件系统中读取。
10.根据权利要求1-4任一项所述的方法,还包括:
执行快照删除,其包括:将虚机待删除的快照索引的删除信息写入日志,当日志中的删除信息量超过预定阈值时,扫描虚机的备份数据以找出一定时间内没有被引用的子数据块和数据片段并将它们删除。
11.一种基于多层排重的虚机快照备份系统,包括:
快照划分模块,用于将虚机快照划分为多个子数据块,将每个子数据块划分为多个数据片段;
快照多层排重模块,用于对所述虚机快照进行多层排重以排除所述虚机快照中会导致重复备份的数据;以及
快照备份存储模块,用于存储经多层排重处理后剩余的快照数据;
其中,所述快照多层排重模块还包括:用于对所述虚机快照划分成的子数据块进行子数据块排重的子数据块排重模块、用于对子数据块划分成的数据片段进行数据片段排重的数据片段排重模块,所述数据片段排重模块具体用于:判断经所述子数据块排重后剩余的子数据块中的多个数据片段自上次备份以来是否改变;排除被确定为未改变的数据片段;保留被确定为已改变的数据片段。
12.根据权利要求11所述的系统,所述快照多层排重模块还包括:公用数据集排重模块,其中,所述公用数据集中存储着备份存储文件系统中重复率高于预定阈值的数据片段。
13.根据权利要求11所述的系统,其中,所述子数据块排重模块被配置判断所述多个子数据块自上次备份以来是否改变,排除被确定为未改变的子数据块,保留被确定为已改变的子数据块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210291388.6/1.html,转载请声明来源钻瓜专利网。