[发明专利]确定针对垃圾收集的去重复存储区中的未引用页面在审
申请号: | 201480083055.1 | 申请日: | 2014-10-28 |
公开(公告)号: | CN107077399A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | J.王;S.纳扎里;S.D.默赛 | 申请(专利权)人: | 慧与发展有限责任合伙企业 |
主分类号: | G06F11/10 | 分类号: | G06F11/10;G06F12/00 |
代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 李雪娜,陈岚 |
地址: | 美国德*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 针对 垃圾 收集 重复 存储 中的 引用 页面 | ||
背景技术
消费者和公司生成和使用的电子数据的数量和大小在规模和复杂性上都会随着相关应用的规模和复杂性的增长而继续增长。作为响应,容纳越来越多且复杂的数据以及相关应用的数据中心已开始实施各种各样的联网和服务器配置来提供数据的存储和对数据的访问。
附图说明
下面的详细描述参考附图,在其中:
图1图示根据本公开的示例的确定去重复(deduplication)存储区中的未引用页面的计算系统的框图;
图2图示根据本公开的示例的确定去重复存储区中的未引用页面的另一计算系统的框图;
图3图示根据本公开的示例的存储用于确定去重复存储区中的未引用页面的指令的计算系统的非瞬时计算机可读存储介质的框图;
图4图示根据本公开的示例的确定去重复存储区中的未引用页面的方法的流程图;
图5图示根据本公开的示例的确定去重复存储区中的未引用页面的方法的流程图;以及
图6图示根据本公开的示例的三级表方案的框图。
具体实施方式
随着用户生成和消费更大数量的数据,对这些数据的存储需求也会增加。较大的数据卷(volume)变得越来越昂贵、耗费时间且耗费空间来存储和访问。此外,重复数据(即与先前存在的数据相同的数据)的数量是常见的。此类重复数据进一步使存储资源担负重担。
在将固态盘(SSD)添加到主要的基于块的存储阵列中所支持的介质中的情况下,这些阵列中的数据重复删除(即检测重复数据)越来越有用。SSD和传统硬盘驱动器之间的成本差异利用比如去重复和压缩之类的解决方案来降低这些存储阵列的每字节成本。在低延时和高吞吐量方面,主机操作系统对主存储阵列的要求是高性能。
随着存储容量增长地越来越大,找出重复数据是对存储阵列的存储控制器的存储器和中央处理单元(CPU)有要求的可伸缩问题。通过各种参数(诸如数据是联机还是在后台去重复、以及去重复的粒度)来确定去重复对输入/输出性能的影响。在提供更好的空间节省的同时在基于块的存储系统中以较小的粒度(诸如16千字节页面)对数据进行去重复需要CPU处理和存储器方面的增加。一些主要的基于块的存储阵列不能够处理输入/输出性能与联机数据去重复的冲突的需求,并且因此诉诸于后台去重复。一些存储阵列还通过以较大的区块(诸如每次多个千兆字节)对数据进行去重复来解决去重复。在其他示例中,例如通过使用密码散列确定重复数据来检测数据重复。这些密码散列利用更多空间来存储和更多处理资源来比较。
在具有去重复功能的基于块的存储系统中,多个客户端页面可能指向去重复存储区中的相同的经去重复的页面。当客户端页面被修改时,客户端页面停止指向去重复存储区中的前一页面并且作为代替指向别处。当所有客户端页面停止指向去重复存储区中的特定页面时,去重复存储区中的页面不再被引用并且可以被解放(free)。因此,跟踪指向去重复存储区中的页面的指针并且当去重复存储区中的页面不再在使用时解放那些页面是经去重复的基于块的存储系统中的根本问题。可以克服这点的一种方式是通过主动维护引用计数并当引用计数减小至零时解放页面。这被称为“标记和清扫(mark and sweep)”技术。然而,当去重复客户端和存储卷在共享的、分布式、基于块的存储系统的不同计算实体上时以容错且原子的(atomic)方式维护引用计数是复杂的。
下面通过参考所公开的用于确定去重复存储区中的未引用页面的若干示例来描述各种实施方式。在根据本公开的方面的一个示例实施方式中,针对对于客户端卷上的数据的接收垃圾(garbage)收集数据请求而计算循环冗余校验(CRC)值。通过使用如图6图示以及下面描述的三级表方案,CRC值被变换成对于客户端卷的去重复存储区中的物理页面位置。然后确定去重复存储区中的物理页面是否是未引用的。在一个示例中,对物理页面是否在去重复存储区中的确定是基于经变换的CRC值、通过将经变换的CRC值与去重复存储区中所存储的多个现有CRC值相比较的。在另一示例中,该确定是基于对物理页面的直接引用的缺乏、通过将经变换的CRC值与去重复存储区中所存储的多个现有CRC值相比较的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧与发展有限责任合伙企业,未经慧与发展有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480083055.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数字麦克风及其控制方法
- 下一篇:一种声音采集方法、系统和装置