[发明专利]用于对处理进行调度以实现空间节省的系统、方法有效
申请号: | 201380023646.5 | 申请日: | 2013-03-11 |
公开(公告)号: | CN104272244B | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | V·K·达盖;C·约翰斯顿;郑玲 | 申请(专利权)人: | NETAPP股份有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 酆迅 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 进行 调度 实现 空间 节省 系统 方法 计算机 程序 产品 | ||
技术领域
本说明书一般涉及网络存储系统中的空间节省操作(例如,压缩和重复数据删除),更具体地,涉及用于在重复数据删除处理中在卷之间分配空间节省资源的技术。
背景技术
许多企业包括连接到客户端计算系统的网络存储系统(诸如网络附属存储(NAS)和存储区域网络(SAN)),由此客户端可以访问由存储系统管理的数据。从用户的(例如,客户端的)观点来讲,网络存储系统可以包括一个或多个存储对象(存储卷),这些存储对象通常被称为逻辑卷或虚拟卷。这样的网络存储系统可以存储非常大量的重复数据,因此,在一些情况下执行重复数据删除以便更高效地使用可用的存储空间可能是希望的。在数据可以在网络存储系统中进行重复数据删除的程度上,重复数据的移除在一些情况下可以提供大量的存储空间节省,由此可能省钱。
用于网络存储的一些常规技术实现与各虚拟卷对应的文件系统,该文件系统提供在虚拟卷内逻辑组织的较低级存储容器(例如,文件)的分层组织,并且利用指针来指向底层数据,其中,底层数据以数据块布置。给定文件可以指向多个块,并且一个块可以与多个文件相关联。此外,给定文件可以包括在另一个文件中重复的数据。例如,存储卷可以包括多个电子邮件收件箱,每个收件箱包括特定的电子邮件附件。在大多数情况下,存储电子邮件附件的多个副本将是不希望的,因为这样做将浪费存储资源。一些常规的重复数据删除操作通过仅留下数据的单个副本并且利用对于该单个副本的指针取代重复副本来避 免保存数据片的多个副本。因此,多个文件与同一数据相关联,但是避免了该数据的重复副本。
重复数据删除操作可能使用大量的处理资源。在一个示例中,常规的重复数据删除处理在尚未进行重复数据删除的卷上开始。常规的重复数据删除处理包括:从储存器(通常为硬盘)读取数据块,创建用于数据块中的每一个的指纹(例如,指纹可以是指示块中的数据的小数据片),以及比较指纹以确定哪些块可能为重复。重复数据然后如上所述用指针取代。然而,通常,该处理可能使用大量的处理能力,从用户的角度来讲,这可以将其自身表现为降低的性能。此外,从盘读取大量的数据块可能会花费相对长的时间。
另一种常规的重复数据删除处理在数据块被保存或者从一个卷传送到另一个卷(例如,在备份操作中)时产生该数据块的指纹。与以上示例对比,这应消除在单个操作中读取整个卷以对该整个卷取指纹。然而,仅仅将指纹彼此进行比较就可能使用大量的处理资源。
简言之,从用户的观点来讲,由于被分配到重复数据删除处理而没有用于对于用户更可见的并发存储和检索操作的处理资源,重复数据删除处理可能导致感觉到性能的不足。假定网络存储系统具有有限量的处理资源以专用于它执行的各种操作,则高效地执行重复数据删除以便从最小量的处理资源得到最大量的重复数据删除将是希望的。
附图说明
当与附图一起阅读时,从以下详细描述最好地理解本公开。
图1是实现可以实现各种实施例的存储操作系统的示例网络存储系统的图示。
图2是根据一个实施例改动的在众多卷之间调度重复数据删除操作的示例方法的图示。
图3是根据一个实施例改动的可与图2中所示的方法一起操作的用于在众多卷之间分配用于重复数据删除的资源的示例方法的图示。
图4是根据实施例改动的可与图2中所示的方法一起操作的在卷 之间分配重复数据删除资源的示例方法的图示。
发明内容
各种实施例包括提供分配重复数据删除资源的高效方法的系统、方法和计算机程序产品。在一个示例中,对于多个存储对象执行多个重复数据删除操作,以使得存储对象中的每一个的传入数据不时地被重复数据删除为现有数据。对于存储对象中的每一个,基于重复数据删除操作的结果来计算重复数据删除值。重复数据删除值提供对于存储对象中的每一个随着时间而实现的重复数据删除量的指示。在这个示例中,假定对于存储对象的过去结果是期望的未来性能的指示,因此,重复数据删除值是重复数据删除节省可能性(potential)的指示。在随后的重复数据删除操作中,具有较高的重复数据删除可能性的存储对象被选择以在具有较低的可能性的其它存储对象之前进行重复数据删除。随着时间而显示出较高的重复数据删除可能性的存储对象可能最终被添加到优选列表。以这种方式,对于空间节省具有较高的可能性的存储对象被给予重复数据删除资源的优先级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于NETAPP股份有限公司,未经NETAPP股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380023646.5/2.html,转载请声明来源钻瓜专利网。