[发明专利]一种热点数据识别方法及装置在审

专利信息
申请号: 200910217194.X 申请日: 2009-12-31
公开(公告)号: CN101788995A 公开(公告)日: 2010-07-28
发明(设计)人: 董浩;龚涛;张翔;杜小华 申请(专利权)人: 成都市华为赛门铁克科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 611731 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 热点 数据 识别 方法 装置
【说明书】:

技术领域

发明涉及存储领域,尤其涉及一种热点数据识别方法及装置。 

背景技术

在计算机的使用过程中会产生大量数据,这些数据都需要被存储在磁盘上以备其他业务使用,许多业务在访问存储系统时,对随机IO并发性都有很高的要求。为满足业务应用的要求,提高存储系统的每秒钟处理IO请求(I/Oper second,IOPS)的能力,引入了热点数据迁移、二级缓存等新技术,而这些技术都依赖于热点数据识别技术。 

现有的热点数据识别技术主要包括,将存储区域划分为若干数据块,对所有数据块做精细化统计,统计若干块被访问的次数,根据被访问的次数计算被访问的频率,再根据块的被访问的频率判断其是否是热点数据区域。例如,以块的大小为32M为例,一个存储空间为2T的存储区域具有2T/32M=64K个块,如果一个存储阵列同时存在2K个这样的存储区域,那么这个存储阵列的存储空间为2T*2K=4P字节,假设块的管理单元是64字节,那么管理4P存储空间需要的统计信息空间为2K*64K*64=8G字节。这些统计信息是存放在高速介质上的,只有最近被访问的数据库的统计信息才会调入内存中,所以对统计信息而言就需要支持换入换出机制。可见,现有的热点数据识别技术较难利用有限的内存空间完成对热点数据的识别,统计信息必须采用换入换出方式实现数据的统计,降低了热点数据识别的效率。 

发明内容

本发明实施例提供了一种热点数据识别方法及装置,可以利用有限的内存空间完成对热点数据的识别。 

本发明实施例提供的热点数据识别方法,包括:根据预置的在内存中创建的第一统计表,获得当前周期内存储区域中的一级颗粒的周期访问频率加权平均值,所述第一统计表用于存储所述一级颗粒的信息; 

当所述一级颗粒的周期访问频率加权平均值达到第一阈值时,将所述一级颗粒确定为热一级颗粒; 

将所述热一级颗粒划分为二级颗粒; 

在内存中创建第二统计表,所述第二统计表用于存储所述二级颗粒的信息; 

根据所述第二统计表,获得下一个周期内所述二级颗粒的周期访问频率加权平均值; 

当所述二级颗粒的周期访问频率加权平均值达到第二阈值时,将所述二级颗粒确定为热点数据区域,所述热点数据区域中的数据为热点数据。 

本发明实施例提供的热点数据识别装置,包括: 

第一计算模块,用于根据预置的在内存中创建的第一统计表,获得当前周期内存储区域中的一级颗粒的周期访问频率加权平均值,所述第一统计表用于存储所述一级颗粒的信息; 

第一确定模块,用于当所述一级颗粒的周期访问频率加权平均值达到第一阈值时,将所述一级颗粒确定为热一级颗粒; 

第二划分模块,用于将所述热一级颗粒划分为二级颗粒; 

第二创建模块,用于在内存中创建第二统计表,所述第二统计表用于存储所述二级颗粒的信息; 

第二计算模块,用于根据所述第二统计表,获得下一个周期内所述二级颗粒的周期访问频率加权平均值; 

第二确定模块,用于当所述二级颗粒的周期访问频率加权平均值达到第二阈值时,将所述二级颗粒确定为热点数据区域,所述热点数据区域中的数据为热点数据。 

从以上技术方案可以看出,本发明实施例具有以下优点: 

本发明实施例不需要对所有数据块都做精细化的统计,采用分级的方法识别热点数据,动态创建二级颗粒,根据与二级颗粒对应的第二统计表,计算该二级颗粒的周期访问频率加权平均值,当该二级颗粒的周期访问频率加权平均值达到第二阈值时,将该二级颗粒确定为热点数据区域,由于只有被确定为热一级颗粒的一级颗粒才被划分为二级颗粒,而不属于热一级颗粒的一级颗粒则不会被划分为二级颗粒,相应的不属于热一级颗粒的一级颗粒则不需要在内存中建立二级统计表进行管理,而一级颗粒不属于精细化的划分,所以其统计表占用内存的资源较少,并且二级统计表是动态建立的,所以本 发明实施例可以利用有限的内存空间完成对热点数据的识别。 

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。 

图1为本发明实施例中数据访问方法一个实施例示意图; 

图2为本发明实施例中数据访问方法另一实施例示意图; 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都市华为赛门铁克科技有限公司,未经成都市华为赛门铁克科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910217194.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top