[发明专利]一种基于本体知识推理的并行网络流量分类方法有效

申请号：	201510974162.X	申请日：	2015-12-22
公开（公告）号：	CN105516020B	公开（公告）日：	2018-09-11
发明（设计）人：	陶晓玲;韦毅;王勇;孔德艳;亢蕊楠;伍欣	申请（专利权）人：	桂林电子科技大学
主分类号：	H04L12/851	分类号：	H04L12/851
代理公司：	桂林市持衡专利商标事务所有限公司 45107	代理人：	欧阳波
地址：	541004 广西***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于本体知识推理并行网络流量分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于本体知识推理的并行网络流量分类方法，根据互联网网络流量采集环境和流量的信息资源构建多层的网络流量本体，将互联网中的每条网络流量对应网络流量本体中的一个网络流量实例，按如下步骤进行分类：

Ⅰ、建立决策树分类模型并生成推理规则集

在互联网中选取网络流量作为样本，已标记应用类型的网络流量样本作为网络流量训练样本集，利用决策树算法训练已标记应用类型的网络流量训练样本集，建立网络流量的决策树分类模型，并将决策树分类模型转化成推理规则集；

Ⅱ、通过知识推理对网络流量实例进行并行化分类

采用Jena工具包将步骤Ⅰ生成的推理规则集构造成相应的推理机；对已构建的网络流量本体，借助MapReduce并行计算框架，调用推理机进行并行知识推理，即挖掘出网络流量本体中网络流量实例和网络应用类型的对应关系，对网络流量实例进行网络应用类型标记，完成网络流量分类。

2.根据权利要求1所述的基于本体知识推理的并行网络流量分类方法，其特征在于：

所述步骤Ⅰ具体包括如下子步骤：

Ⅰ-1、借助决策树算法对已标记应用类型的网络流量训练样本集进行训练，建立网络流量的决策树分类模型，集合A＝{a₁,a₂,……,a_i}表示由网络流量训练样本集中i个网络流量的统计特征值组成的集合；集合T＝{t₁,t₂,……,t_j}表示由网络流量训练样本集中j种网络流量所属的应用类型组成的集合；集合V＝{v₁,v₂,……,v_k}表示由k个决策判定基准值组成的集合，它由集合A中的各个元素经过决策树算法统计计算得出，作为决策树中选取决策路径的判定依据；

Ⅰ-2、网络流量的决策树分类模型中从根节点到每个子叶的路径均视为分类路径，以决策判定基准值为依据，将网络流量的决策树分类模型中的每条分类路径均转化成“如果-则”，即“IF-THEN”结构，建立IF-THEN结构的网络流量分类模型；

Ⅰ-3、采用Jena工具包的推理规则语法描述步骤Ⅰ-2建立的IF-THEN结构的网络流量分类模型，并生成推理规则集。

3.根据权利要求1所述的基于本体知识推理的并行网络流量分类方法，其特征在于：

所述步骤Ⅱ具体包括如下子步骤：

Ⅱ-1、采用Jena工具包将步骤Ⅰ生成的推理规则集构造成相应的推理机；

Ⅱ-2、根据每个计算节点的性能以及网络流量本体中所描述的网络流量实例的数据规模，对已构建好的网络流量本体进行分割，得到多个网络流量本体分片，将网络流量本体分片上传至Hadoop分布式文件系统，并对每一个网络流量本体分片进行标识；

Ⅱ-3、启动多个MapReduce的映射函数，以<网络流量本体分片标识符，网络流量本体分片>为键值对、输入到映射函数；

Ⅱ-4、映射函数利用步骤Ⅱ-1构建的推理机对网络流量本体分片进行知识推理，得到网络流量本体分片中每条网络流量实例对应的网络应用类型标签；

Ⅱ-5、以<网络应用类型标签，网络流量实例>为键值对、输出到规约函数；

Ⅱ-6、规约函数根据网络应用类型标签合并网络流量实例，形成已分类网络流量实例集；

Ⅱ-7、输出已分类网络流量实例集，完成网络流量分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。