[发明专利]基于上下文感知的重复数据删除的方法和装置有效
| 申请号: | 201380078408.4 | 申请日: | 2013-12-23 |
| 公开(公告)号: | CN105493080B | 公开(公告)日: | 2019-08-16 |
| 发明(设计)人: | 阿里尔·库利克;吉尔·赛森 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06F16/174 | 分类号: | G06F16/174 |
| 代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 上下文 感知 重复 数据 删除 方法 装置 | ||
1.一种基于上下文感知的数据重复数据删除的方法,其特征在于,包括:
通过将已写入数据的至少一个结构元数据加载到元数据存储器缓存(40)中以及将已缓存的待写入数据分成数据片,将重复数据删除模块分配(S1)给写操作;
通过扫描所述元数据存储器缓存(40)中的所述已缓存的结构元数据,计算(S2)每个数据分段中所述待写入数据的所述数据片的数目,所述片的数目表示所述数据分段的得分;以及
调用(S3)数据分段选择进程,从而基于所述数据分段的所述得分提供数据分段集以对所述待写入数据进行重复数据删除。
2.根据权利要求1所述的方法,其特征在于,分配(S1)所述重复数据删除模块包括利用所述已写入数据的上下文感知处理或利用所述已写入数据的逻辑块寻址生成所述元数据。
3.根据权利要求1或2所述的方法,其特征在于,
通过加载所述已写入数据的所述至少一个元数据分配(S1)所述重复数据删除模块包括加载所述已写入数据的先前版本和/或加载所述已写入数据的多个先前版本中的任何版本和/或加载所述已写入数据的相邻数据块。
4.根据前述权利要求1或2所述的方法,其特征在于,
在将已缓存的所述待写入数据分成所述数据片过程中,对所述已写入数据和所述待写入数据的至少一个哈希值进行计算。
5.根据前述权利要求1或2所述的方法,其特征在于,
所述已写入数据是一个数据块。
6.根据权利要求5所述的方法,其特征在于,
所述数据块是一个字节序列,具有在1兆字节至10兆字节之间的块大小或任何其它块大小。
7.根据权利要求5所述的方法,其特征在于,
所述数据块的大小不是固定的。
8.根据前述权利要求1或2所述的方法,其特征在于,
每个数据片是一个字节序列,具有1千字节、2千字节、4千字节、8千字节的平均片大小或1至512千字节之间的任何大小。
9.根据权利要求8所述的方法,其特征在于,
所述数据片的大小是可变的。
10.一种基于上下文感知的重复数据删除的装置(100),其特征在于,所述装置包括:
重复数据删除模块(10),用于将已写入数据的至少一个结构元数据加载到元数据存储器缓存(40)中以及将已缓存的待写入数据分成数据片;
处理模块(20),用于通过扫描所述元数据存储器缓存(40)中的所述已缓存的结构元数据计算每个数据分段中所述待写入数据的所述数据片的数目,所述片的数目表示所述数据分段的得分;以及
数据选择模块(30),用于基于所述数据分段的所述得分提供数据分段集以对所述待写入数据进行重复数据删除。
11.一种主机节点HN的备份系统BS,其特征在于,包括文件系统FS和根据权利要求10所述的基于上下文感知的重复数据删除的装置(100)。
12.一种带有程序代码的计算机介质,其特征在于,当所述程序代码在计算机上运行时,所述程序代码用于执行权利要求1至9中的任一权利要求所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380078408.4/1.html,转载请声明来源钻瓜专利网。





