[发明专利]一种自适应的半监督网络流量分类方法、系统及设备有效

专利信息
申请号: 201711103942.2 申请日: 2017-11-10
公开(公告)号: CN107846326B 公开(公告)日: 2020-11-10
发明(设计)人: 冉静;孔晓晨;刘元安;胡鹤飞;袁东明 申请(专利权)人: 北京邮电大学
主分类号: H04L12/26 分类号: H04L12/26;H04L12/851;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自适应 监督 网络流量 分类 方法 系统 设备
【说明书】:

发明涉及一种自适应的半监督网络流量分类方法、系统及设备,该方法包括:获取网络流,提取每条网络流中预设固定量的流特征,得到网络流特征向量;根据已标记的网络流特征向量,计算出每个类型中的网络流特征向量集合的质心,得到向量集M;以向量集M为初始中心点,进行自适应的半监督k‑means聚类;根据最大后验概率,将得到的每类簇中的网络流映射到所属的流量类型;将已知类型的流量簇作为训练数据,训练出线上的流量分类器。还涉及一种系统,该系统包括:获取模块、向量集处理模块、聚类模块、分类模块、输出模块。还涉及一种设备,该设备包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序。

技术领域

本发明属于网络流量管理领域,尤其涉及一种自适应的半监督网络流量分类方法、系统及设备。

背景技术

传统的基于网络流的方法大多采用监督的或无监督的机器学习算法来实现网络流量分类。在有监督的流量分类中,学习引擎接受一组已标记的流样本,根据预定义的协议类别进行训练,然后返回一个训练好的分类模型,该分类模型可以预测未来网络流的协议类型。然而,随着网络的迅速扩展,互联网上部署了许多新的应用程序,这些应用对应的未知流是基于监督学习的分类方法无法处理的。在这种情况下,未知流将被错误地划分到某个预定义的流量类别中去,并影响分类器的整体精度。基于无监督学习的分类方法可以自动聚类未标记的训练样本,应用聚类结果构建流量分类器。但是聚类簇的数目必须被设置得足够大,以得到高纯度的流量簇,而且很难在没有监督信息的情况下将大量的流量簇映射到少量的流量类别中。

因此,传统的流量分类方法在标记信息不足,且网络中存在未知流量的现实情况下表现不佳。为了解决这个问题,Erman等人首先提出了将半监督学习方法应用到流量分类中,利用有标记流和未标记流的混合输入,训练出一个可以将已知协议分类的同时提取出未知协议的分类器。张等人扩展了Erman的工作,提出了一种改进的半监督流量分类方法,该方法在复杂的网络环境下表现良好。但是这样依然存在一些问题,比如:在训练阶段不能自动确定最佳参数,需要人工手动调参,不能实现系统的参数自适应。

发明内容

本发明所要解决的技术问题是:现有的在训练阶段不能自动确定最佳参数,需要人工手动调参,不能实现系统的参数自适应。

为解决上面的技术问题,本发明提供了一种自适应的半监督网络流量分类方法,其特征在于,该自适应的半监督网络流量分类方法包括:

S1,获取已标记类型和未标记类型的网络流,提取每条网络流中预设固定量的流特征,得到网络流特征向量;

S2,根据已标记的网络流特征向量,计算出每个类型中的网络流特征向量集合的质心,得到向量集M;

S3,以所述向量集M为k-means聚类的初始中心点,对混合的已标记类型和未标记类型的网络流特征向量集X进行自适应的半监督k-means聚类;具体地,首先得到k个簇和k个簇中心点,分别计算具体定义的评价函数,同时更新所述向量集M,得到新的向量集M,并计算出距离新的向量集M的中心点最远的k个向量点,根据具体定义的密度计算公式,确定在最远的k个向量点中密度最大的向量点,并将密度最大的向量点添加到新的向量集M中;然后设置新的k值,根据所述新的中心点集M和所述新的k值,重复执行上一步骤,直到k值大于预设最大阈值;最后统计所有评价函数的值,从所有评价函数的值中选取最小评价函数的值,以及与该最小评价函数的值对应的k值,并输出在所述对应的k值时k-means的聚簇;

S4,根据输出的聚簇中每个簇的已标记网络流特征向量的最大后验概率,将得到的每类簇中的网络流映射到所属的流量类型中,得到已知类型的流量簇;

S5,将所述已知类型的流量簇作为训练数据,训练出线上的流量分类器。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711103942.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top