[发明专利]一种网络流量批量生成图像的方法及装置有效
申请号: | 201910985203.3 | 申请日: | 2019-10-16 |
公开(公告)号: | CN110768864B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 陈红松;陈京九 | 申请(专利权)人: | 北京科技大学 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;G06K9/62 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络流量 批量 生成 图像 方法 装置 | ||
1.一种网络流量批量生成图像的方法,其特征在于,包括:
获取原始网络流量数据集及相应的类别标签;
对网络流量生成图像的高度H和宽度W进行初始化,并根据分类模型对输入图像的要求对H和W进行优化;其中,H用于体现网络流量时间和空间特征信息,W用于体现网络流量特征数;
根据优化后的H,采用基于窗口的数据抽取算法对原始网络流量数据集进行数据抽取,根据优化后的H和W生成抽取出的数据集对应的灰度图像,得到网络流量图像集;
所述根据分类模型对输入图像的要求对H进行优化包括:
A1,确定窗口大小w、抽取阈值α和保留阈值β,初始化类别计数器的数值和当前迭代次数k;其中,w=H;
A2,对原始网络流量数据集DA第(k-1)*w+1条记录到第(k+1)*w条记录的类别标签进行读取,每读到一个类别标签,相应的类别计数器加1;
A3,判断任一类别计数器的数值是否大于等于窗口大小w与抽取阈值α的乘积,若大于等于,则将当前窗口样本抽出放入抽取后的数据集DB中;
A4,令k=k+1,循环执行步骤A2和A3,直至完成原始网络流量数据集最后一条数据的抽取后,执行步骤A5;
A5,将抽取后的数据集DB各类别样本数分别除以抽取前各类别样本数,若所有比值均大于β且H值满足分类模型对输入图像高度的要求,则设定H值为图像的高度;否则,则返回步骤A1,重新确定β值或H值,直至所有比值均大于β且H值满足分类模型对输入图像高度的要求;
所述根据分类模型对输入图像的要求对W进行优化包括:
利用机器学习中的分类算法对原始网络流量数据集中的原始网络流量特征进行特征重要性排序;
选取重要性最高的前W个特征作为抽取出的数据集的特征,若W值满足分类模型对输入图像宽度的准确度要求,则设定W值为图像的宽度;若W值不满足准确度要求,则减少W值,直到满足准确度要求。
2.根据权利要求1所述的网络流量批量生成图像的方法,其特征在于,在设定网络流量生成图像的初始高度H和宽度W,并根据分类模型对输入图像的要求对H和W进行优化之前,所述方法还包括:
对获取的原始网络流量数据集进行预处理,其中,预处理包括:对原始网络流量数据中的缺失值进行填充、异常值进行替换,并对原始网络流量数据中的字符型数据进行编码;
对预处理后的网络流量数据进行均值方差归一化处理,使所有的网络流量数据在[0,1]区间内。
3.根据权利要求1所述的网络流量批量生成图像的方法,其特征在于,所述根据优化后的H,采用基于窗口的数据抽取算法对原始网络流量数据集进行抽取包括:
B1,确定窗口大小w,并初始化类别计数器的数值和当前迭代次数k;其中,w等于优化后的H;
B2,对原始网络流量数据集DA第(k-1)*w+1条记录到第(k+1)*w条记录的类别标签进行读取,每读到一个类别标签,相应的类别计数器加1;
B3,判断任一类别计数器的数值是否大于等于窗口大小w与抽取阈值α的乘积,若大于等于,则将当前窗口样本抽出放入抽取后的数据集中;
B4,令k=k+1,循环执行步骤B2和B3,直至完成原始网络流量数据集最后一条数据的抽取。
4.根据权利要求1所述的网络流量批量生成图像的方法,其特征在于,所述根据优化后的H和W生成抽取出的数据集对应的灰度图像,得到网络流量图像集包括:
将抽取出的数据集转化为高度为H、宽度为W的特征矩阵;
将矩阵中的值乘以255,得到[0,255]区间的数据,将其作为图像对应像素点的灰度值,得到大小为H*W的灰度图像,并标注类别标签,得到网络流量图像集。
5.根据权利要求4所述的网络流量批量生成图像的方法,其特征在于,在根据优化后的H和W生成抽取出的数据集对应的灰度图像,得到网络流量图像集之后,所述方法还包括:
生成的网络流量图像集作为输入图像,构建网络安全分类模型,实现攻击类别分类。
6.一种网络流量批量生成图像的装置,其特征在于,包括:
获取模块,用于获取原始网络流量数据集及相应的类别标签;
优化模块,用于对网络流量生成图像的高度H和宽度W进行初始化,并根据分类模型对输入图像的要求对H和W进行优化;其中,H用于体现网络流量时间和空间特征信息,W用于体现网络流量特征数;
生成模块,用于根据优化后的H,采用基于窗口的数据抽取算法对原始网络流量数据集进行数据抽取,根据优化后的H和W生成抽取出的数据集对应的灰度图像,得到网络流量图像集;
所述优化模块包括:高度优化单元;所述高度优化单元,用于执行步骤A1-A5:
A1,确定窗口大小w、抽取阈值α和保留阈值β,初始化类别计数器的数值和当前迭代次数k;其中,w=H;
A2,对原始网络流量数据集DA第(k-1)*w+1条记录到第(k+1)*w条记录的类别标签进行读取,每读到一个类别标签,相应的类别计数器加1;
A3,判断任一类别计数器的数值是否大于等于窗口大小w与抽取阈值α的乘积,若大于等于,则将当前窗口样本抽出放入抽取后的数据集DB中;
A4,令k=k+1,循环执行步骤A2和A3,直至完成原始网络流量数据集最后一条数据的抽取后,执行步骤A5;
A5,将抽取后的数据集DB各类别样本数分别除以抽取前各类别样本数,若所有比值均大于β且H值满足分类模型对输入图像高度的要求,则设定H值为图像的高度;否则,则返回步骤A1,重新确定β值或H值,直至所有比值均大于β且H值满足分类模型对输入图像高度的要求;
所述优化模块还包括:
宽度优化单元,用于利用机器学习中的分类算法对原始网络流量数据集中的原始网络流量特征进行特征重要性排序,选取重要性最高的前W个特征作为抽取出的数据集的特征,若W值满足分类模型对输入图像宽度的准确度要求,则设定W值为图像的宽度;若W值不满足准确度要求,则减少W值,直到满足准确度要求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910985203.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序