[发明专利]基于增量式闭合序列挖掘的高速缓存数据预取方法无效

申请号：	200810059854.1	申请日：	2008-02-22
公开（公告）号：	CN101266578A	公开（公告）日：	2008-09-17
发明（设计）人：	陈刚;蔡铭;李山亭	申请（专利权）人：	浙江大学
主分类号：	G06F12/08	分类号：	G06F12/08;G06F17/30
代理公司：	杭州求是专利事务所有限公司	代理人：	林怀禹
地址：	310027浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于增量闭合序列挖掘高速缓存数据方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及高速缓存数据预取技术，尤其是涉及一种基于增量式闭合序列挖掘的高速缓存数据预取方法。

背景技术

近年来，为了减少处理器等待读取数据的时间，提出了使用高速缓存的技术。采用高速缓存的系统芯片的相关部分如图1所示，该系统芯片包括处理器、高速缓存、高速缓存预取模块、内存，系统总线。其中处理器从高速缓存中读取数据并进行计算以及向高速缓存预取模块发送预取数据的控制信息；高速缓存中保存的是处理器将要使用的数据；高速缓存预取模块用于从系统内存读取处理器即将使用的数据，并将数据传输到高速缓存；内存中保存着各种数据；系统芯片总线连接所述高数缓存预取模块和内存，并传递各种控制信息。

为提高高速缓存的效率(提高命中率)，在高速缓存未命中发生之前，需要高速缓存预取模块进行数据预加载(pre-load)(或预取(pre-fetch))，即把将要使用的数据预先填充到高速缓存中。存在几种公知的数据预取技术。一种是顺序预取，即预取地址空间的下一顺序行。另一种是分支预测技术，使用分支目标缓存器，当一个高速缓存行被引用时，它的相关联的分支目标地址是预取的良好候选者。

这些公知的数据预取技术，都采用简单的预取模式，高速缓存的命中率不高，预取没有利用数据块之间的语义联系，不具有智能性。因此，在高数缓存预取模块中引入语义模式，充分挖掘数据块之间的语义联系，提高高速缓存的命中率是十分有必要的。

序列模式挖掘是数据挖掘中的一项重要任务.其目的是在给定的序列数据库中挖掘出所有的满足最小支持度要求的频繁序列，以产生相应的规则或模式.这类模式有着广泛的应用，如分析顾客的购物习惯、Web页面的访问顺序、DNA序列等等。而频繁闭合序列拥有与完全频繁序列集相同的表达能力，却有着更加简洁的形式和少得多的数量，充分减少了结果集的冗余度。

将闭合序列挖掘引入高速缓存的数据预取模块中，通过对存储数据存取系列挖掘出相应的频繁闭合序列，产生数据预取的规则，从而使得数据块之间具有语义联系，数据预取智能化，这是有实际意义的。UIUC的Zhenmin等使用闭合序列模式挖掘算法Clospan的变种CMiner挖掘存储系统的数据存取序列的数据相关性，明显地提高了I/O平均响应时间。CMiner挖掘方法是针对静态数据库进行的，不能针对实时的环境进行挖掘，而存储数据的存取序列是动态更新的，特点是变化幅度小，频率高，因此需要一种更加高效的实时闭合序此列挖掘方法来满足需求。

发明内容

本发明的目的在于提供一种基于增量式闭合序列挖掘的高速缓存数据预取方法。

本发明解决其技术问题所采用的技术方案是：

1、用于存储系统的高速缓存数据预取模块中的数据预取步骤中的，通过采集CPU向内存请求的数据存取序列，将其转换为序列输入数据库，采用增量式闭合序列挖掘算法挖掘频繁闭合序列，提取出高速缓存数据预取规则，用于指导高速缓存的数据预取，提高高速缓存的命中率；

(1)采集CPU访问内存存取序列：实时记录CPU请求访问的文件系统中的逻辑块号组成的序列，每一个文件系统的逻辑块号为序列中的一个项目；

(2)预处理：处理步骤(1)得到的CPU访问内存存取序列，将步骤(1)得到的CPU访问内存存取序列划分为固定长度的序列，此序列为一个窗口，此序列长度为窗口大小，一个窗口作为一条输入序列，存入输入序列数据库中；

(3)训练：对步骤(2)得到的序列输入数据库采用增量式的闭合序列挖掘方法进行挖掘得到频繁闭合序列集合，每当步骤(2)有新的输入序列时，在已有的闭合序列挖掘的结果基础上，结合新增输入序列，增量式挖掘新的频繁闭合序列模式集合；

(4)规则生成：对步骤(3)得到的频繁闭合序列进行分解得到所蕴含的所有规则，并通过规则评估函数对规则进行评估，去除不符合要求的规则，最后得到高效的用于高速缓存数据预取的指导规则。

2.步骤(2)设置一个计数器，初始值为零，步骤(1)每采集一个项目，计数器增加1，当计数器值等于窗口大小时，把步骤(1)采集得到的序列作为一条记录存入序列输入数据库中，并清除步骤(1)的记录。计数器重置为0，取下一条存入序列输入数据库的记录，如此循环下去；

3.步骤(3)对步骤(2)得到的序列输入数据库，简称为SDB采用增量式的闭合序列挖掘方法进行挖掘得到频繁闭合序列集合的具体步骤如下：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810059854.1/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F12-00 在存储器系统或体系结构内的存取、寻址或分配
G06F12-02 .寻址或地址分配；地址的重新分配
G06F12-14 .阻止存储器越权使用的保护
G06F12-16 .阻止存储物丢失的保护
G06F12-04 ..字长可变的字或字的一部分的寻址
G06F12-06 ..物理存储块定位的寻址，例如，基地址寻址、模块寻址、专用存储区寻址

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于增量式闭合序列挖掘的高速缓存数据预取方法无效

专利文献下载