[发明专利]组合型类不均衡流量分类的特征选择方法有效
申请号: | 201910077766.2 | 申请日: | 2019-01-28 |
公开(公告)号: | CN109981335B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 唐宏;刘丹;姚立霜;王云锋;裴作飞 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | H04L41/142 | 分类号: | H04L41/142;G06K9/62 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 卢胜斌 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 组合 型类不 均衡 流量 分类 特征 选择 方法 | ||
本发明公开了一种组合型类不均衡流量分类的特征选择方法,采用非搜索型算法利用加权对称不确定性WSU来计算类别与特征之间的相关度,根据特征之间的WSU滤除冗余特征,从而得到第一目标特征集合,可以显著降低后续特征子集筛选的计算复杂度,然后采用SFS算法进一步降低特征的维数,直到特征数增加到指定的维数为止,这样就可以减小样本分布不平衡问题给网络流量分类带来的不良影响,选择出具有强区分能力的特征集合,从而可以显著提高网络流量的分类精度。
技术领域
本发明涉及网络流量分类技术领域,更具体地说,涉及一种组合型类不均衡流量分类的特征选择方法。
背景技术
随着互联网的飞速发展,网络覆盖范围不断扩大,网络应用种类不断增多。这些变化在给人们的生活带来便利的同时,也给网络的运营管理带来了巨大的挑战。网络研究人员提出了一系列的措施来保证网络的健康运行,但无论是基于用户需求实现业务的高效承载,还是根据网络应用的发展趋势对现有的网络进行扩容改造,都必须对网络流量中的各种应用进行准确的分类与识别。此外,在入侵检测等领域,网络流量分类具有极其重要的意义。
网络流量分类是指基于TCP/IP协议的Internet中,按照网络的应用类型(HTTP、DNS、FTP、P2P等),将网络通信产生的双向TCP流或UDP流进行分类。在对网络流量进行分类前,通常需要对数据进行预处理。在数据预处理时,一般会对流量特征进行降维,因为网络流量的特征一般都是高维的,其中包含大量的无关特征和冗余特征,这些特征可能会降低分类器的性能。特征选择是实现特征降维的一种方式,其目的就是从一组给定的特征集合中挑选出部分特征作为最优特征子集。
目前对特征选择方法的研究主要集中于搜索策略和评价准则。1)按照搜索策略,可以将特征选择算法分为全局最优搜索策略、随机搜索策略以及启发式搜索策略3类。全局最优搜索策略是对原始特征集的全部特征进行搜索,从而发现相关性强的特征,构建最佳分类效果的特征子集,但是此算法处理高维多类问题时运算效率低,且难以事先确定最优子集的特征数目,难以设计满足要求的评价准则;随机搜索策略通过设定阀值和迭代次数,对原始特征集进行特征选择,选择特征分类相关性紧密的特征子集,此类算法需要设定一些参数,参数的选择对最后结果的影响较大;启发式搜索策略相对来说较好实现,在整个搜索过程中搜索空间相对较小,能够对原始特征子集进行快速的搜索,选择出最佳的特征子集,但是此类算法以牺牲全局最优为代价获得较高的运算速率,在计算复杂度与最优解之间折中。2)根据评价策略可以将特征选择算法分为三大类:滤波式(Filter)、封装式(Wrapper)和嵌入式(Embedded)。三者的区别在于是否使用后续学习算法来评价特征子集的性能。Filter方法与后续的学习算法无关,Wrapper方法则需要利用后续的学习算法进行特征评估,Embedded方法则将特征选择融入到后续学习算法中。
现有的大部分传统特征选择方法是以提高分类精度为优化目标,没有充分考虑数据样本的分布状况,且普遍追求大类的学习效果,容易忽略小类的学习性能。
发明内容
为解决上述技术问题,本发明提供一种组合型类不均衡流量分类的特征选择方法。
本发明采用的技术方案是:
一种组合型类不均衡流量分类的特征选择方法,包括:
S1:对网络流量样本数据进行统计得到统计结果,每一条网络流量对应的样本数据包括该网络流量所属的类别信息以及多个属性特征的取值;
S2:根据所述统计结果计算网络流量类别与各属性特征之间的相关度,并基于所述相关度从多个属性特征中进行筛选得到第一目标特征集合;
S3:将第二目标特征集合初始化为空集;
S4:计算所述第一目标特征集合中每一属性特征的特征评估函数值,将当前计算得到的最大特征评估函数值对应的属性特征加入所述第二目标特征集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910077766.2/2.html,转载请声明来源钻瓜专利网。