[发明专利]基于模式融合的CPU负载多步预测方法在审
申请号: | 201410183205.8 | 申请日: | 2014-05-04 |
公开(公告)号: | CN104021045A | 公开(公告)日: | 2014-09-03 |
发明(设计)人: | 曹健;杨定裕;顾骅;沈琪骏;王烺 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模式 融合 cpu 负载 预测 方法 | ||
技术领域
本发明涉及服务器CPU负载预测技术领域,具体涉及一种基于模式融合的CPU负载多步预测方法。
背景技术
在分布式系统中,可用的资源是随时间变化的,同时调度系统也需要做出相应的变化。由于地理上的分布情况,在现实中监控和采集资源的数据分布存在延迟,难以实时的获取当前的可用资源,因此通过性能预测能够方便资源管理与调度。
CPU负载的监控与预测是应用程序的成功运行的必要条件,CPU负载能够显示机器的性能状态。如果CPU负载过高,服务器的性能将会严重降低。高负荷的CPU负载的服务器异常状态会引起系统崩溃,有效地监控与预测CPU负载可以帮助管理员采取相应的对策,如关闭或重启应用程序,升级硬件等。
以往的研究证明CPU负载可以记录成一个时间序列数据,通过时间序列预测算法对CPU负载进行预测,但是这些模型不能有效的支持多步预测。多步预测比单步预测更具有挑战性,也更有意义。多步预测能够知道将来更长时间内CPU负载的趋势,能够给管理员和调度系统足够的时间去处理异常事件。
现有的多步预测方法是基于迭代单步预测,这种方法对步数较少的预测比较适用,但是如果步数较大,会出现预测结果偏移越来越大的问题。如前面几步预测结果已经出现误差,那么后面的预测将难以估计准确值。
近年来,在预测过程中,基于模式匹配的方式也有流行,它们是通过计算模式与模式之间的欧几里得距离来度量数据之间相似性。这种匹配方式过于拟合,无法估计模式的方向性或者趋势性,存在一定匹配误差,无法准确估计预测结果。
发明内容
本发明的目的在于提供一种基于模式融合的CPU负载多步预测方法,本发明提供了对服务器CPU负载进行长期预测的方法,该方法预测精度高,具有准确性高、可靠性高的优点。
为达到上述目的,本发明提供一种基于模式融合的CPU负载多步预测方法,包括以下步骤:
步骤1:模式抽取
把一个时间序列数据切分成多个数据模式的集合,并统计各个数据模式的个数;
步骤2:模式过滤
经过步骤1得到所有的模式与个数,过滤一些不常出现的模式,对这些模式统计,根据个数从大到小进行排序,给定一个过滤因子α,使过滤后的模式能够覆盖大部分模式;
步骤3:模式融合、匹配
对于一些模式相差不大的模式,合并成一些通用的趋势模式,并根据这些通用的趋势模式进行匹配,在匹配过程中,采用汉明距离来度量模式与模式之间的方向距离,然后使用欧几里得距离来度量实际距离;
步骤4:模式加权预测
经过步骤3找到一些近似模式后,采用平均规则策略或均匀下降策略根据这些模式的后面的值来进行多步预测;
步骤5:预测结果融合
采用多个模式长度来指导预测,并根据每个模式长度的预测值进行融合,采用机器学习Adaboost算法进行合成,得到最终结果。
依照本发明较佳实施例所述的基于模式融合的CPU负载多步预测方法,步骤1中:
时间序列数据是一系列数据x1,x2,x3,…,xn,这些数据之间存在有序性;
数据模式是给定一个时间序列数据,从时间序列数据中找打一个子序列Cp=xp,xp+1,…,xp+w-1,这个子序列在历史数据中经常出现。
依照本发明较佳实施例所述的基于模式融合的CPU负载多步预测方法,步骤2中,过滤因子α满足以下条件:
其中,Qi是一个长度为i的模式集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410183205.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:配电网单相接地故障定位方法
- 下一篇:一种灯丝LED灯泡