[发明专利]一种基于PCA和XGBoost融合的业务类型识别方法在审

专利信息
申请号: 202111202293.8 申请日: 2021-10-15
公开(公告)号: CN114048795A 公开(公告)日: 2022-02-15
发明(设计)人: 刘旭;胡俊华;朱晓荣;杨龙祥;朱洪波;江婷 申请(专利权)人: 南京邮电大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 朱桢荣
地址: 210000 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 pca xgboost 融合 业务 类型 识别 方法
【说明书】:

发明公开了一种基于PCA和XGBoost融合的业务类型识别方法,包括以下步骤:步骤S1、采集带有标签的网络流量数据集,网络流量数据集的业务类型包括HTTP、NTP、DNS、QQ、微信、视频和邮件;步骤S2、对步骤S1中的网络流量数据集进行数据清洗和特征提取,从而得到含有多维特征的网络流量数据集;步骤S3、利用主成分分析特征降维的方法将步骤S2中的多维特征简化成低维特征,得到带标签的低维数据集;步骤S4、得到训练好的极限梯度提升XGBoost分类模型;步骤S5、将待测的网络流量数据集输入到步骤S4中的极限梯度提升XGBoost分类模型,得到业务类型分类结果。本发明不仅可以降低识别方法的复杂度,同时还能够提高对业务类型识别的精度。

技术领域

本发明涉及通信网络技术领域,特别是一种基于PCA和XGBoost融合的业务类型识别方法。

背景技术

随着信息技术的不断发展,互联网流量规模也在逐年增大,网络新业务层出不穷。虽然这大大促进了我们社会的进步与发展,这些新业务的普及也为电信运营商吸纳了大量的客户资源,但是网络中包含了各种各样的加密流量,对网络的底层流量模型和上层应用模式产生了很大的冲击,而为了提高网络管理、改善网络服务、保障网络环境安全,有效地识别各类应用业务的加密流量,从而构建“可运营、可管理”的网络成了现在一个关键的研究方向。

传统的业务类型识别方法有基于端口的流量识别方法和基于深度包检测(DPI)的流量识别方法。基于端口的流量识别是通过TCP/UDP数据包报头中的已知端口号对网络流量进行分类,最初,这种方法对于实时流量分类非常有效且易于实现,但是,如今各种网络应用程序并未使用众所周知的端口来避免被检测到,而且某些网络应用程序在使用时可能使用动态端口号。因此,现在基于端口的流量分类不能产生真实的结果,分类精度不高。而基于深度包检测(DPI)的流量识别方法,本质上是一种数据报文过滤技术,DPI除了支持L2层数据链路层、L3层网络层、L4层传输层的报文首部解析之外,还增加了对L7层应用层有效载荷的解析,可以识别各种应用类型及其内容。但是由于目前大多数业务使用各种加密技术来禁止对包有效载荷进行检查,因此深度包检测(DPI)的分类精度也不是很高。当前的趋势是使用机器学习的方法来进行IP流量分类。

近年来,基于机器学习的人工智能技术在计算机视觉、自然语言处理、语音识别、图像医疗等方面取得了瞩目的成就,在很多领域的表现都远远优于传统解决方案。这充分彰显了机器学习在处理分类任务时的科学性以及有效性,机器学习和数据挖掘技术也逐渐在网络空间安全领域得到应用与发展,因此机器学习技术也为解决传统方法解决的加密流量分类问题提供了可能性。传统的业务类型识别方法无法识别加密流量且存在识别的准确率较低等问题。

发明内容

本发明所要解决的技术问题是克服现有技术的不足而提供一种基于PCA和XGBoost融合的业务类型识别方法,不仅可以降低识别方法的复杂度,同时还能够提高对业务类型识别的精度。

本发明为解决上述技术问题采用以下技术方案:

根据本发明提出的一种基于PCA和XGBoost融合的业务类型识别方法,包括以下步骤:

步骤S1、采集带有标签的网络流量数据集,网络流量数据集的业务类型包括HTTP、NTP、DNS、QQ、微信、视频和邮件;

步骤S2、对步骤S1中的网络流量数据集进行数据清洗和特征提取,从而得到含有多维特征的网络流量数据集;

步骤S3、利用主成分分析特征降维的方法将步骤S2中的多维特征简化成低维特征,得到带标签的低维数据集;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111202293.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top