[发明专利]一种基于装载因子的缓存数据预加载与替换方法有效

专利信息
申请号: 201410166680.4 申请日: 2014-04-22
公开(公告)号: CN103942315B 公开(公告)日: 2017-03-22
发明(设计)人: 王新根;王新宇 申请(专利权)人: 杭州邦盛金融信息技术有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F12/0893
代理公司: 杭州求是专利事务所有限公司33200 代理人: 邱启旺
地址: 310006 浙江省杭州市西*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 装载 因子 缓存 数据 加载 替换 方法
【说明书】:

技术领域

发明涉及一种基于海量数据环境的数据缓存方法,尤其涉及一种对海量数据实现快速缓存预加载和替换的方法。

背景技术

随着企业的全球化及海量数据处理的需求不断发展,证券、银行等大型金融企业积累了海量的用户数据,数据量和用户数的剧增,给这些企业系统带来了很大的压力,高速增长的用户请求以及海量的后台数据给Web系统带来了很多性能问题,导致整个系统响应缓慢,用户体验急剧下降。“要么改进系统,要么流失客户。”正是工业界很多公司不得不面对的问题,如何有效减少用户访问延时,提高系统服务质量是一个迫切需要解决的难题。缓存技术被认为是一种有效的解决方案,它能有效缓解Web系统瓶颈、减少网络数据传输以及提升系统的扩展性。

Web缓存技术可以极大的提高系统的响应速度,在近几年的研究中,提出了很多种缓存方法,它们一般基于数据的一些特性,比如最近访问时间、访问次数、数据大小,数据加载成本以及数据修改时间等,通过对这些基础的数据特征分析采用不同的方法来确定缓存策略,试图尽量减少各种成本度量,从而提高命中率,减少数据访问延时和成本。

目前对于缓存技术的研究主要分为缓存预取方法和缓存替换方法两方面,缓存预取是一种主动式的缓存技术。其基本思想是利用先前用户访问的模式和先验知识,把用户最有可能访问的内容预先加载到缓存中。根据预取算法使用的用户行为特征信息不同,可以分为以下两类:

一、基于多用户的行为模式:利用所有或多个用户的行为模式的特征,不管当前请求的用户是谁,都预取相同的数据,一个典型的例子是根据流行度缓存排在前10的数据。

二、基于单用户的行为模式:这种模式基于对单个用户的行为进行分析,并基于用户的行为模式进行预测,一个典型的例子是利用马尔可夫模型(Markov modeling),其基本思想是根据用户的访问历史建立一个马尔可夫图,并用该图来预测用户下一步的行为。

然而传统的缓存方法要么只是着眼于单个用户的访问习惯,基于当前用户的行为模式进行预测,没有从全盘考虑缓存性能,或者需要加载所有数据才能判断哪些数据是需要缓存的,对于海量数据来说,加载所有数据是不可能的。因此传统的缓存方法并不适合海量数据的应用服务。

发明内容

针对传统缓存方法存在的问题,本发明提供了一种基于装载因子的缓存数据预加载与替换方法,实现在海量数据模式下,对数据的快速预加载和替换。装载因子直观地说就是在Ri次对数据的读请求中数据命中缓存的次数。该方法基于数据的整体分布因子来计算各个数据的装载因子,根据数据的装载因子来判断该数据是否应该放在缓存中。因为装载因子是表示数据命中缓存的次数,因此当装载因子占比数据读取次数Ri超过一定阀值的时候,我们就可以认为该数据更适合预先装载到缓存中,从而在系统初始化的时候采取加载该数据的策略。基于以上描述,给出数据定义如下:

Ri:数据对象i的读请求数;

Pi:在Ri次读请求中,数据对象i命中缓存的次数,即装载因子;

λ:系统的数据分布因子,反应了系统整体的数据分布情况。

基于以上定义,装载因子的数据预加载和替换方法步骤描述如下:

一、计算系统的数据分布因子λ,λ反应系统整体的数据分布,对于符合一定分布模型的系统,比如泊松分布的数据,λ可以从理论上计算得到,对于无法通过理论计算获得λ,需要用数据库统计算法得到;

二、数据预加载,系统启动的时候,加载数据库中的数据,并根据系统的数据分布因子计算该数据的装载因子Pi,根据数据的装载因子确定该数据是否应该预先加载到缓存中,当的时候,加载该数据到缓存中,否则该数据不预加载;

三、系统预加载后缓存数据采用惰性更新的方式,当用户访问某个数据的时候,重新计算该数据的装载因子,根据新的装载因子来判断该数据是放到缓存中还是从缓存中移除;

四、当第三步有新的数据需要装入缓存而缓存数据已满的情况,则采用最近最少使用LRU方法替换缓存中的数据。

五、更新数据分布因子λ,当数据量比较少的时候,对于海量数据系统来说,分布因子λ不会有明显的变化,但当数据累积到一定量后则会影响整个系统的数据分布,为了计算的准确性,需要隔一段时间(比如一天一次)重新计算下分布因子λ。然后再循环采用执行第三步~第五步的步骤,保持缓存中数据的时效性和命中率。

本发明具有如下技术效果:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州邦盛金融信息技术有限公司,未经杭州邦盛金融信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410166680.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top