[发明专利]基于随机森林的周期性流量预测方法有效
申请号: | 202110267095.3 | 申请日: | 2021-03-11 |
公开(公告)号: | CN113067724B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 张岗山;何丁乐;赵林靖;刘炯;吴炜 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | H04L41/0896 | 分类号: | H04L41/0896;H04L41/147;H04L43/0876;G06N20/00 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;黎汉华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 森林 周期性 流量 预测 方法 | ||
1.一种基于随机森林的周期性流量预测方法,其特征在于,包括如下步骤:
(1)采集各类别应用程序的流量数据;
(2)将每个数据流划分为时间序列,提取每个时序点的八个特征,即序号k、时序点内数据包总字节数B1、时序点内最大数据包字节数B2、时序点内最小数据包字节数B3、时序点内平均数据包大小Ba、时序点内最大数据包发送时间间隔t1、时序点内最小数据包发送时间间隔t2、时序点内平均数据包发送时间间隔ta;
(3)构建周期指标确定算法:
(3a)计算数据流时间序列的周期起始点ns、周期大小Tc、周期相似度F这三个特征;
(3b)将步骤(3a)计算的这三个特征和步骤(2)中提出的k、B1、B2、B3、Ba、t1、t2、ta八种特征,作为第一训练集,输入到随机森林算法,设置该算法的第一初始参数,对训练集执行二分操作,将训练集分为两部分,再对每次二分后的训练集重复执行二分操作,得到一个二叉树结构,当树结构到达设定树的最大深度20时,停止二分操作,训练结束,得到用于确定时间序列的周期指标确定算法;
(4)构建数据预测算法:
(4a)求出时间序列中ns+1至最后一个点ne的每个时序点k在周期中的相对位置nq及所处周期的序号Tq;公式如下:
nq=(k-ns)mod Tc,
其中,ns为时间序列的周期起始点、Tc为时间序列的周期大小;
(4b)将步骤(4a)求出的两个参数与步骤(3)中的ns、Tc、F和步骤(2)中的B1、k这些特征作为第二训练集,输入到随机森林算法,设置该算法的第二初始参数,对训练集执行二分操作,并对每次二分后的训练集重复执行二分操作,得到一个二叉树结构,当树结构到达设定树的最大深度18时,停止二分操作,训练结束,得到用于预测时序点数据大小的数据预测算法;
(5)通过周期指标确定算法和数据预测算法对未知数据流进行预测:
(5a)使用步骤(2)中的方法统计未知数据流前N个时序点中每个时序点的八种时序特征k′、B1′、B2′、B3′、Ba′、t1′、t2′、ta′,并将这N个时序点的八个特征全部输入到周期指标确定算法中,输出该数据流的周期起始点ns′、周期大小Tc′、周期相似度F′,其中,N为步骤(3)中所有时间序列中ns的最大值;
(5b)根据步骤(5a)得到未知数据流的周期起始点ns′、周期大小Tc′、周期相似度F′,提取出ns′之后的所有时序点,使用步骤(4a)中的方法求出这些时序点的周期特征k′、Tq′、nq′,并将ns′、Tc′、F′和所有时序点的k′、Tq′、nq′共六个特征,输入到数据预测算法中,输出各个时序点的预测数据值。
2.根据权利要求1所述的方法,其特征在于,步骤(1)中采集各类别应用程序的流量数据,采取被动监听方式获取应用运行过程中的数据包及数据包的信息:每个数据包的字节数大小Bi、数据包发送时刻tk和数据包发送间隔Δk。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110267095.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:镜头、摄像模组及电子设备
- 下一篇:一种两点固定的汽车后盖电泳接漆辅具