[发明专利]一种低能耗集群环境下基于频度关联的冷数据放置策略有效
| 申请号: | 201710839180.6 | 申请日: | 2017-09-18 |
| 公开(公告)号: | CN107728938B | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 邓玉辉;胡程 | 申请(专利权)人: | 暨南大学 |
| 主分类号: | G06F3/06 | 分类号: | G06F3/06;G06F12/08 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈燕娴 |
| 地址: | 510632 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 能耗 集群 环境 基于 频度 关联 数据 放置 策略 | ||
1.一种低能耗集群环境下基于频度关联的冷数据放置策略,其特征在于,所述的放置策略包括下列步骤:
S1、数据识别器开始工作,同时网络存储系统工作一段指定的时间后,根据负载的平均值,得到处理负载需要的存储节点个数,并附加一定量的存储节点以应对高负载情况,得到网络存储系统初始时热节点的数量;
S2、数据初始化放置,根据热节点的数量,对网络存储系统进行划分,其中热节点个数设置为此数量,作为热节点集合,剩余节点作为冷节点集合,各存储节点数据缓存置空,根据数据识别器的识别情况,区分放置到最佳节点的数据缓存中;
S3、网络存储系统正常运行,热节点一直处于正常工作状态,而冷节点在无任务请求一段时间后转入休眠状态,当任务到来时才被唤起以处理任务请求,运行过程中若出现数据属性改变情况时,则执行步骤S4,否则执行步骤S5;
S4、数据动态迁移,当原为热数据的数据转为冷数据时,该数据被迁移到关联度最佳的冷节点数据缓存中,而当原为冷数据的数据转为热数据时,该数据被迁移到负载最轻的热节点数据缓存中,继续返回执行步骤S3;
S5、历史信息清理,网络存储系统运行时间较长后,数据识别器清理过时的历史访问信息,清理完成后,继续返回执行步骤S3。
2.根据权利要求1所述的一种低能耗集群环境下基于频度关联的冷数据放置策略,其特征在于,所述的数据识别器在记录数据访问信息时,将时间分为多个等长时间段,以时间段作为基本记录单位,当收到数据访问请求时,记录该数据的访问次数,同时区分出当前所处的时间段。
3.根据权利要求1所述的一种低能耗集群环境下基于频度关联的冷数据放置策略,其特征在于,所述的网络存储系统包含一个元数据服务器和若干存储节点,元数据服务器在网络存储系统起到管理器的作用,客户机发送访问请求给网络存储系统,访问请求通过元数据服务器检索到数据所在节点后,请求被交于此节点处理,所述的元数据服务器在所述的网络存储系统初始化阶段对系统进行初始化:将存储节点划分成冷节点集合和热节点集两部分,并执行数据初始化迁移。
4.根据权利要求1所述的一种低能耗集群环境下基于频度关联的冷数据放置策略,其特征在于,所述的步骤S3、网络存储系统正常运行中,每次请求到来,数据识别器都对访问的数据做记录,若数据识别器发现数据属性发生改变,则将该数据迁移到合适的节点上。
5.根据权利要求2所述的一种低能耗集群环境下基于频度关联的冷数据放置策略,其特征在于,所述的数据识别器记录下每个时间段内每个被访问的数据的访问次数,然后对数据按访问次数降序排序,得到排序靠前的数据作为高频访问数据,即热数据,其他数据则判别为低频访问数据,即冷数据;同时,根据每个时间段内数据共同被访问的情况,所述的数据识别器计算出数据间的关联强度,其中冷数据之间的关联强度达到阀值则认为数据之间具有关联度。
6.根据权利要求5所述的一种低能耗集群环境下基于频度关联的冷数据放置策略,其特征在于,若某数据的访问总次数位于全部被访问数据的前20%,则该数据被判定为热数据。
7.根据权利要求1所述的一种低能耗集群环境下基于频度关联的冷数据放置策略,其特征在于,所述的步骤S4、数据动态迁移,当原为热数据的数据转为冷数据时,该数据被迁移到关联度最佳的冷节点数据缓存中,若出现关联度相同或全为0的情况,则选择其中负载较轻的节点作为目标节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710839180.6/1.html,转载请声明来源钻瓜专利网。





