[发明专利]一种基于云计算的数据备份方法有效
| 申请号: | 201510027730.5 | 申请日: | 2015-01-20 |
| 公开(公告)号: | CN104536849B | 公开(公告)日: | 2017-10-20 |
| 发明(设计)人: | 刘洋;敬皓 | 申请(专利权)人: | 成都携恩科技有限公司 |
| 主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F17/30 |
| 代理公司: | 北京天奇智新知识产权代理有限公司11340 | 代理人: | 郭霞 |
| 地址: | 610041 四川省成都市高新区*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 计算 数据 备份 方法 | ||
1.一种基于云计算的数据备份方法,其特征在于,包括:
云平台通过数据去重处理进行备份数据的压缩,记录每个数据段写操作的版本信息,在数据恢复时查询并读取对应的版本信息进行数据恢复;
所述备份数据的压缩进一步包括:
在数据保护模式下,所述云平台业务接口不断从客户系统接收写操作流数据段,客户将自身驱动层的所有段写入请求发送给业务接口;
把接收到的每一个请求都切分成若干个四元组<Client_ID,LA,Timestamp,Seg_Data>,每个元组表示对某个段的一次写操作;其中Client_ID表示客户的编号;LA表示目标段的逻辑段号;Timestamp表示写请求发生的时间戳;Seg_Data表示新写入的段数据;
将每个段的写操作的Seg_Data传递给云平台的数据去重模块,计算出Seg_Data_ID即Seg_Data的标识符进行去重;
将新段的写操作传递给云平台的版本索引模块,记录相应的版本信息,在索引更新粒度上采用定期更新策略,每次索引更新时,读取当前的一级索引,将内存cache内每个段的新版本记录追加到该段的一级索引记录区末尾,二级索引是一个固定长度的结构,在新的一级索引生成之后进行原地更新,在索引更新开始前,一个新的内存cache会被生成,以容纳新的记录,而已有的cache则在更新操作完成之后被释放;
根据数据去重模块的结果更新元数据信息,对新的Seg_Data建立新的元组并赋初始值,对重复的Seg_Data则更新其引用计数;
将每一个新段的写操作信息传递给云平台的磁盘缓存模块,仅将磁盘缓存内不存在的Seg_Data写入磁盘,同步更新所有Seg_Data在磁盘缓存中的位置和引用计数信息;
利用云平台中的数据归档模块,从去重得到所有的去重结果批量存储到云端,同时更新其云端位置信息。
2.根据权利要求1所述的方法,其特征在于,所述云平台包括业务接口模块,客户通过统一的业务接口与云平台系统进行业务交互,在进行数据保护时,被保护系统将自身驱动层的所有段写入请求都拷贝一份发送给业务接口,把接收到的每一个请求都切分成个四元组<Client_ID,LA,Timestamp,Seg_Data>,每个元组表示对某个段的一次写操作;其中Client_ID表示客户的编号;LA表示目标段的逻辑段号;Timestamp表示写请求发生的时间戳;Seg_Data表示新写入的段数据。
3.根据权利要求2所述的方法,其特征在于,所述云平台在进行数据恢复时,客户将恢复请求三元组〈Timestamp,Start_LA,End_LA>发送给业务接口;其中Timestamp指明需要恢复的时间点;Start_LA和End_LA则表示需要进行恢复的逻辑段地址起止范围;如果客户需要删除部分版本数据,则将一个删除请求二元组<Start_Timestamp,End_Timestamp>发送给业务接口,指明其需要删除的版本时间戳范围。
4.根据权利要求1所述的方法,其特征在于,所述云平台的版本索引模块为每个客户都维护独立的版本索引,保存该客户所有段的所有版本信息;版本索引在逻辑上存储的是从二元组〈LA,Timestamp>到Seg_Data的映射关系;版本索引由存储在磁盘上的两级索引和在内存cache组成;磁盘索引定期进行更新操作,而内存cache则存储上次磁盘索引更新之后直至当前的新增的段版本信息,磁盘索引分为一级索引和二级索引,一级索引由固定长度的二元组<Ti,j,Bi,j>顺序组成,Ti,j,Bi,j分别表示对第i号段的第j次写入操作的时间戳和Seg_Data_ID;二级索引由固定长度的三元组<Ai,Ti,Bi>顺序组成,其中Ai表示第i号段的版本信息在一级索引中的起始位置,Ti,Bi则表示该段最新版本的时间戳和Seg_Data_ID;内存cache使用一个散列表结构来存储若干对段号和指针,每个指针指向一个队列,指明上次磁盘索引更新后发生的对某个段的新写入信息,cache内的信息被同步写入到一个磁盘日志中,以便系统异常重启之后可以恢复这些信息。
5.根据权利要求1所述的方法,其特征在于,所述云平台的数据去重模块用于对每一个新的Seg_Data使用hash算法计算其Seg_Data_ID,通过比对该标识符,判断此Seg_Data是否与已有的Seg_Data重复,进而进行去重,云平台采用统一的后端存储池,其数据去重是针对所有客户的所有段的版本数据进行的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都携恩科技有限公司,未经成都携恩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510027730.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





