[发明专利]一种基于哈希的远程差异合成备份实现方法有效
申请号: | 201410002008.1 | 申请日: | 2014-01-02 |
公开(公告)号: | CN103838645B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 叶佑群 | 申请(专利权)人: | 上海爱数信息技术股份有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F17/30;H04L29/08 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 赵继明 |
地址: | 201112 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 远程 差异 合成 备份 实现 方法 | ||
技术领域
本发明涉及一种远程备份实现方法,尤其是涉及一种基于哈希的远程差异合成备份实现方法。
背景技术
随着计算机在人们生活及生产中所起的作用越来越重要,用计算机来存储相关的数据也越来越多。数据是人们在使用计算过程当中产生的用来记录重要信息的载体,因此保证数据完整性与安全就是保证人们生活与生产活动的顺利进行。然而由于计算机本身的物理特性,保存在其上的数据会因为各种外部原因的冲击而不可用,比如物理损坏、被盗、电力中断等等都可能导致存储在计算机上的数据丢失。为了保证数据持续可用,最好的方式就是保证数据的冗余存储,即将数据存储在两个或者多个位置。
为了应用各种破坏数据的场景,不同的技术被开发出来用于数据的冗余存储,像RAID(Redundant Array ofIndependent Disks,独立磁盘冗余阵列)系统可以用来保证在物理介质损坏时的数据冗余,而远程备份方法则可以保证在计算机受到自然灾害、被盗或者物理介质损坏的情况下数据的冗余存储。
远程备份方法通常有定时的备份方法,即在设定的时间点启动备份任务。在这种备份方式下,备份程序通过读取文件的时间标签以确定文件是否被更改过,如果文件被更改就备份该文件,否则就不备份。这种方式一个明显的缺陷就是,就算是文件一个字节都未更改,只是变更了时间标签,这个文件都需要备份。特别是当文件的尺寸很大时,备份所带来的时间以及网络消耗是非常大的。
为了解决上面的备份方式所带来的问题,则使用另一种实时的备份方式,即利用监控文件的方式来读取文件的变化数据,只备份向文件中写入的数据。当文件有变化时,就将变化的数据写入到备份目的地去。这种方式虽然解决了上面备份大文件的问题,但是也有相应的缺陷。如果当频繁写文件的相同位置时,这种备份方式会将这些变化的数据存储多份,即使其实只需要最后一次变化的数据。其次,要实时监控文件的写操作,需要在系统上安装相应的监控程序,每增加一个监控的文件,就要占用一定的系统资源,因此,当需要监控的文件非常多时,对于系统资源有限的系统来说就不一定能够实施了。特别是监控与备份跟正常业务是同时进行的,因此会对正常的业务造成影响。
如果有另一种备份方法能够只备份变化的文件差异的部份,同时又不会造成对业务的影响的话,那么这种备份方式则可以解决上面所述的备份方法所具有的缺陷。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种备份数据量少、网络利用率高、数据存储空间少、处理速度快的基于哈希的远程差异合成备份实现方法。
本发明的目的可以通过以下技术方案来实现:
一种基于哈希的远程差异合成备份实现方法,包括以下步骤:
1)备份客户端获取需要备份的源文件,设定备份类型,并根据源文件生成文件列表,所述的备份类型包括“全备份”或“差异备份”;
2)判断是否存在与文件列表相关的编录信息文件,若是,则直接执行步骤3),若否,则生成一个空的编录信息文件后,执行步骤3);
3)根据文件列表和编录信息文件计算差异数据,并保存至备份服务器中;
4)获取此次备份的备份类型,若备份类型为“全备份”,则备份服务器对每个文件执行差异合成备份,执行步骤5),若备份类型为“差异备份”,则直接执行步骤5);
5)备份结束。
所述的编录信息文件包括哈希表、文件备份时使用的哈希块长度和文件记录信息,所述的记录信息包括文件名称、文件大小和文件最后修改时间。
所述的步骤3)具体为:
3.1)从文件列表中取得下一个需备份的文件作为当前文件,判断当前文件是否为空,若是,则执行步骤4),若否,则执行步骤3.2);
3.2)根据文件名称判断编录信息文件中是否存在当前文件的编录信息,若是,则当前文件为第一次备份,执行步骤3.6),若否,则执行步骤3.3);
3.3)获取当前文件的大小SIZE,利用如下公式求得当前文件所对应的哈希块长度L:
L=L1+[(L1%SIZE)/(SIZE/L1)]
其中,L1%SIZE表示的是L1对SIZE求余数;
3.4)从当前文件开头起,以步骤3.3)计算的哈希块长度L为单位,计算每一块数据的“快哈希”与“慢哈希”,形成当前文件的哈希表,将哈希表、哈希块长度和文件记录信息保存至编录信息文件中;
3.5)将当前文件的完整数据保存至备份服务器,即当前文件的备份类型为“全备份”,返回步骤3.1);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海爱数信息技术股份有限公司,未经上海爱数信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410002008.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:西洋参皂苷注射剂及其制备方法
- 下一篇:一种柜门可转动的机柜