[发明专利]经去重复文件的细粒度部分召回有效
申请号: | 201480010936.0 | 申请日: | 2014-02-26 |
公开(公告)号: | CN105009119B | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | P·谢;C·H·张;K·汉萨恩;A·古普塔;R·卡拉赫;D·赫芬布罗克 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/174 | 分类号: | G06F16/174 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈小刚 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重复 文件 细粒度 部分 召回 | ||
1.一种在计算环境中的系统,包括:细粒度部分召回机制,配置成与文件相关联地维护哪一个或多个文件数据范围相对于包括块存储中的干净数据的干净范围而言是脏的信息,其中每一个脏范围具有独立于文件系统范围跟踪粒度的大小,并且其中所述细粒度部分召回机制在多个分层安排的位图数据结构中与所述文件相关联地维护所述信息,其中所述多个分层安排的位图数据结构包括用于跟踪实际脏范围的主召回位图和以更大粒度来跟踪聚集的脏范围的召回位图索引表。
2.如权利要求1所述的系统,其特征在于,将一个或多个范围变脏成一个或多个脏范围的写数据量不与范围对齐相对齐,并且其中所述细粒度部分召回机制还被配置成从所述块存储召回数据以与所述一个或多个脏范围相对齐。
3.如权利要求1所述的系统,还包括:去重复系统,配置成将所述文件的状态从部分经去重复状态变回完全经去重复状态或较少部分经去重复状态,包括在所述文件被打开以供写入时。
4.一种在计算环境中的方法,包括:在一个或多个跟踪数据结构中跟踪部分召回的文件的哪些范围是脏的,其中每一个脏范围具有独立于文件系统范围跟踪粒度的大小,所述跟踪数据结构是多个分层安排的位图数据结构,其中所述多个分层安排的位图数据结构包括用于跟踪实际脏范围的主召回位图和以更大粒度来跟踪聚集的脏范围的召回位图索引表;以及基于一个或多个转储清除准则,将所述一个或多个跟踪结构从易失性存储器懒惰地转储清除到非易失性存储器。
5.如权利要求4所述的方法,其特征在于:基于一个或多个转储清除准则懒惰地转储清除所述一个或多个跟踪结构包括基于最后转储清除对照阈值时间值来评估时间,或对照最大值来评估待决转储清除的数量。
6.一种方法,包括:优化打开文件,包括使用跟踪哪一个或多个文件范围是脏的以及哪些是干净的数据,其中每一个脏范围具有独立于文件系统范围跟踪粒度的大小,其中所述数据被维护在多个分层安排的位图数据结构中,并且其中所述多个分层安排的位图数据结构包括用于跟踪实际脏范围的主召回位图和以更大粒度来跟踪聚集的脏范围的召回位图索引表,并截除所述干净范围。
7.如权利要求6所述的方法,其特征在于,还包括跟踪哪些写发生在范围已被优化之后。
8.根据权利要求6所述的方法,其特征在于:优化所述文件包括在持续优化中优化所述文件,其中所述文件的各子部分在不同的时间被优化。
9.如权利要求6所述的方法,其特征在于,还包括:跟踪发生在截除开始点之前的一个或多个读请求,并且不截除文件流数据直至发生在所述截除开始点之前的每一读请求完成为止;以及跟踪在截除点之前开始的一个或多个读请求,并避免未完成的读请求的截除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480010936.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:预测存储服务
- 下一篇:基于情境的无查询搜索