[发明专利]基于随机森林的周期性流量预测方法有效

专利信息
申请号: 202110267095.3 申请日: 2021-03-11
公开(公告)号: CN113067724B 公开(公告)日: 2022-04-19
发明(设计)人: 张岗山;何丁乐;赵林靖;刘炯;吴炜 申请(专利权)人: 西安电子科技大学
主分类号: H04L41/0896 分类号: H04L41/0896;H04L41/147;H04L43/0876;G06N20/00
代理公司: 陕西电子工业专利中心 61205 代理人: 王品华;黎汉华
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 随机 森林 周期性 流量 预测 方法
【权利要求书】:

1.一种基于随机森林的周期性流量预测方法,其特征在于,包括如下步骤:

(1)采集各类别应用程序的流量数据;

(2)将每个数据流划分为时间序列,提取每个时序点的八个特征,即序号k、时序点内数据包总字节数B1、时序点内最大数据包字节数B2、时序点内最小数据包字节数B3、时序点内平均数据包大小Ba、时序点内最大数据包发送时间间隔t1、时序点内最小数据包发送时间间隔t2、时序点内平均数据包发送时间间隔ta

(3)构建周期指标确定算法:

(3a)计算数据流时间序列的周期起始点ns、周期大小Tc、周期相似度F这三个特征;

(3b)将步骤(3a)计算的这三个特征和步骤(2)中提出的k、B1、B2、B3、Ba、t1、t2、ta八种特征,作为第一训练集,输入到随机森林算法,设置该算法的第一初始参数,对训练集执行二分操作,将训练集分为两部分,再对每次二分后的训练集重复执行二分操作,得到一个二叉树结构,当树结构到达设定树的最大深度20时,停止二分操作,训练结束,得到用于确定时间序列的周期指标确定算法;

(4)构建数据预测算法:

(4a)求出时间序列中ns+1至最后一个点ne的每个时序点k在周期中的相对位置nq及所处周期的序号Tq;公式如下:

nq=(k-ns)mod Tc

其中,ns为时间序列的周期起始点、Tc为时间序列的周期大小;

(4b)将步骤(4a)求出的两个参数与步骤(3)中的ns、Tc、F和步骤(2)中的B1、k这些特征作为第二训练集,输入到随机森林算法,设置该算法的第二初始参数,对训练集执行二分操作,并对每次二分后的训练集重复执行二分操作,得到一个二叉树结构,当树结构到达设定树的最大深度18时,停止二分操作,训练结束,得到用于预测时序点数据大小的数据预测算法;

(5)通过周期指标确定算法和数据预测算法对未知数据流进行预测:

(5a)使用步骤(2)中的方法统计未知数据流前N个时序点中每个时序点的八种时序特征k′、B1′、B2′、B3′、Ba′、t1′、t2′、ta′,并将这N个时序点的八个特征全部输入到周期指标确定算法中,输出该数据流的周期起始点ns′、周期大小Tc′、周期相似度F′,其中,N为步骤(3)中所有时间序列中ns的最大值;

(5b)根据步骤(5a)得到未知数据流的周期起始点ns′、周期大小Tc′、周期相似度F′,提取出ns′之后的所有时序点,使用步骤(4a)中的方法求出这些时序点的周期特征k′、Tq′、nq′,并将ns′、Tc′、F′和所有时序点的k′、Tq′、nq′共六个特征,输入到数据预测算法中,输出各个时序点的预测数据值。

2.根据权利要求1所述的方法,其特征在于,步骤(1)中采集各类别应用程序的流量数据,采取被动监听方式获取应用运行过程中的数据包及数据包的信息:每个数据包的字节数大小Bi、数据包发送时刻tk和数据包发送间隔Δk。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110267095.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top