[发明专利]一种适用于入侵检测的分类方法有效
申请号: | 201710207086.9 | 申请日: | 2017-03-31 |
公开(公告)号: | CN106973057B | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 张石;沈海斌;佘斌;孙世春 | 申请(专利权)人: | 浙江大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种适用于入侵检测的分类方法,根据SVM分类算法对类别不均衡数据集较为敏感及其在核空间进行分类的特点,通过对训练用样本集中的少数类样本集采取基于核SMOTE的过采样,同时对多数类样本集采取基于核的模糊C均值聚类欠抽样的混合采样方式,实现不均衡训练数据集的均衡化预处理,然后在新得到的训练样本集上采用Bagging集成学习方法训练出基于SVM的集成分类器。该方法训练出来的模型不仅可以有效改善传统SVM入侵检测模型针对入侵数据识别效果不理想及对正常数据误判率较高的缺点,并且采用的Bagging集成算法适合大规模并行计算。 | ||
搜索关键词: | 一种 适用于 入侵 检测 分类 方法 | ||
【主权项】:
1.一种适用于入侵检测的分类方法,其特征在于包括如下步骤:1)对入侵检测标准数据集进行样本特征参数归一化处理;2)在核空间对不均衡样本集混合采样改善类别均衡度;采用核SMOTE算法对少数类样本进行过采样处理,得到过采样样本集;对多数类样本集采用基于核的模糊C均值聚类算法进行欠采样得到欠采样样本集;将上述得到的过采样样本集与欠采样样本集合并得到新的训练用均衡样本集;所述的步骤2)中采用核SMOTE算法对少数类样本进行过采样处理,具体为:设待处理的少数类样本集为:F={x1,x2,...xn},xi∈Rh,i=1,2,…,n,核函数K(·)和非线性映射
相关,其中H是特征向量空间,Rh是原始输入空间,映射
是将集合F中的样本映射到特征向量空间H中;步骤2.1.1:首先根据训练样本集中的多数类样本与少数类样本的样本差值,确定需要生成的人工样本的数目D;步骤2.1.2:在特征向量空间中生成人工少数类样本:步骤2.1.3:按照排列的序号顺序从中选取一个少数类样本xi∈Rh,i=1,2,…,n,求出该样本在特征向量空间中的k个少数类最近邻,最近邻求法如下:
对少数类样本按照di的值从小到大进行排列,选择排列前k个少数类样本,这k个样本就是xi的k个最近邻;步骤2.1.4:随机在这k个少数类最近邻中选择一个样本xj,并且生成一个数值范围在(0,1)内的随机数λi;步骤2.1.5:在特征向量空间中利用距离法生成新的样本fi:
步骤2.1.6:如果生成的人工少数样本数目不足,则重复步骤2.1.3到步骤2.1.5的过程,直到人工少数类样本的数目满足要求,至此少数类样本在核空间的过抽样算法结束;3)在上述得到的训练用均衡样本集上,采用Bagging方法构建多个训练子集,并分别对每个训练子集用SVM基分类器进行学习,得到集成分类器;4)分类器识别:在识别阶段,通过由步骤3)产生的基分类器来对测试集进行分类,最终预测结果采取加权投票得出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710207086.9/,转载请声明来源钻瓜专利网。