[发明专利]互联网流量分级分类方法无效
| 申请号: | 201110351826.9 | 申请日: | 2011-11-09 |
| 公开(公告)号: | CN102394827A | 公开(公告)日: | 2012-03-28 |
| 发明(设计)人: | 李君;朱健蓉;斯科忆;张莱蕾;张韡珺 | 申请(专利权)人: | 浙江万里学院 |
| 主分类号: | H04L12/56 | 分类号: | H04L12/56;H04L29/06 |
| 代理公司: | 宁波市鄞州甬致专利代理事务所(普通合伙) 33228 | 代理人: | 代忠炯 |
| 地址: | 315100 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 互联网 流量 分级 分类 方法 | ||
1.一种互联网流量分级分类方法,其特征在于:它包括以下步骤:
A、粗粒度分类:采用基于机器学习的流统计特性法快速分类网络流量,把网络流量分成不同特征的应用类别类,粗粒度分类区分出的流量若需要使用,就直接输出,若需要进一步分类,则进入下一步;
B、细粒度分类:在粗粒度分类区分出的应用类别类中进行再一次分类,步骤如下:
1、采用端口匹配识别法进行分类,输出已分类的流量,
2、将上步完成后剩下的未分类流量,根据DPI流量特征标签库执行DPI分析识别法,分离出各应用流量,并输出,
3、对于上步完成后剩下的加密和未知流量,采用半监督机器学习算法分离并输出加密流量,余下的标识为未知的网络应用流量,
4、对标识为未知的网络应用流量,按分组长度执行基于最长公共子序列的应用层特征标签自动提取,
5、将上步中自动提取的新特征标签经确认补充到DPI特征标签库,输出已确认应用类型并添加标记的该未知应用流量。
2.根据权利要求1所述的互联网流量分级分类方法,其特征在于:所述步骤4中,按分组长度执行基于最长公共子序列的应用层特征标签自动提取的提取方法步骤如下:
(1)目标应用流量按五元组聚集成流,并置入流池,所述五元分别为源地址、目标地址、源端口、目标端口、传输层协议;
(2)对流池中的目标应用流量根据{流持续时间,流的总字节数,分组到达时间间隔最大值,分组净荷长度最小值}所构成的向量采用k-means聚类网络应用流,去除噪声流;
(3)对同一网络应用流的平均分组长度用X-Means算法聚类,然后分别在聚类的样本流中各自提取应用层特征;
(4)确定每流有效检测分组数Npacket及分组净荷要检查的字节数Nbyte,然后截取应用流中的相应净荷信息组装成字符串,在预处理得到的k个字符串中求取最长公共子序列;
(5)执行基于最长公共子序列的应用层特征提取算法得到应用层特征标签。
3.根据权利要求2所述的互联网流量分级分类方法,其特征在于:所述步骤(5)中基于最长公共子序列的应用层特征提取算法包括以下步骤:
a、在目标应用的流池中任取两个流,根据分组长度分别在净荷长度相近的分组中提取最长公共子序列S_L和S_S作为候选特征,记为str1;
b、在流池中任取一个新流,求新流与str1的最长公共子序列,记为新的候选特征str2;
c、重复b步,直到前后两次得到的候选特征str1和str2相同或者流池中的流已被取完为止;
d、把当前的候选特征str2作为最终的应用层特征输出;
e、网络应用特征唯一化:剔除与其它应用协议相同的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江万里学院,未经浙江万里学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110351826.9/1.html,转载请声明来源钻瓜专利网。





