[发明专利]一种基于多任务学习的加密流量分类系统、方法、计算机及存储介质在审
| 申请号: | 202211166951.7 | 申请日: | 2022-09-23 | 
| 公开(公告)号: | CN115563533A | 公开(公告)日: | 2023-01-03 | 
| 发明(设计)人: | 孙广路;李叶光;黄凯 | 申请(专利权)人: | 哈尔滨理工大学 | 
| 主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214;H04L47/2441 | 
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 | 
| 地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 任务 学习 加密 流量 分类 系统 方法 计算机 存储 介质 | ||
本发明为提高加密流量分类模型的泛化能力,提出一种基于多任务学习的加密流量分类方法。本发明包括:将采集到的带标签的加密流量数据按双向流分割,每条双向流的数据作为一个训练样本;提取所述训练样本的时间序列特征,将其做为多任务分类模型的输入;设置多任务分类模型的辅助任务和主任务,并设计辅助任务的类别划分器,为每条流量数据添加对应的辅助任务标签;构建基于软参数共享机制的多任务分类模型;将所述训练样本的时间序列特征输入多任务分类模型,根据各个任务对应的标签同时训练多个任务,每个任务都有独立的输出。
技术领域
本发明涉及计算机网络安全技术领域,更具体地,本发明涉及一种基于多任务学习的加密流量分类系统、方法、计算机及存储介质,该方法在加密流量分类方面有着很好的应用。
背景技术
随着互联网及各种在线应用的快速增长,加密流量在网络传输中的比重越来越大,这给流量识别和分类带来了巨大的挑战。加密流量采用的端口混淆和端口跳变技术导致传统的基于端口的流量识别方法的准确率大幅下降,加密流量对传输载荷进行加密的特性也导致了基于载荷关键字的流量识别方法的准确率下降。此外,传统的机器学习方法也已不太适用加密流量的分类,该类方法不能捕获复杂模式下互联网流量,导致准确性下降,且大多依赖于从整个流量中获得的统计特征,不适合早期分类。
随着深度学习在图像识别、文本翻译和自动驾驶等领域取得的巨大成功,越来越多的研究者尝试将深度学习的模型和方法应用到加密流量识别领域。这是因为深度学习能够学习复杂模式和进行自动特征提取,因此可通过对握手阶段中未加密的时序特征进行提取,采用不同的深度学习算法可实现对相应加密流量的分类。其中,CNN、RNN等算法在流量分类中应用颇为广泛,但大多数应用于单任务场景中。多任务学习的方法与单任务相比,其优势在于多任务学习将多个相关的任务同时并行学习,梯度同时反向传播,多个任务通过底层的共享表示来互相帮助学习,可以提升模型的泛化效果。
发明内容
为了解决加密流量分类问题,本发明公开了一种基于多任务学习的加密流量分类系统,包括,数据处理模块、特征提取模块、生成主任务及辅助任务模块、软参数共享机制模块;
所述数据处理模块用于对得到的加密流量数据进行流分割,如果两条流数据满足传输层协议相同,一条流的源IP、目的IP、源端口号、目的端口号与另一条流的目的IP、源IP、目的端口号、源端口号相同,则合并为双向流,每条双向流数据作为一个训练样本;
所述特征提取模块用于对预处理后的样本进行时间序列特征提取,主要提取的特征有数据包的到达间隔时间、数据包的长度、数据包的方向;
所述生成主任务及辅助任务模块用于确定系统分类的目标,主任务目标是实现对流量进行服务类型的分类,辅助任务目标是实现流量的带宽分类和持续时间分类;
所述软参数共享机制模块用于构建多任务分类模型的共享层,设置专家网络和门控网络,将所述训练样本的时间序列特征输入多任务分类模型,根据各个任务对应的标签同时训练多个任务,每个任务都有独立的输出。
为此,本系统提供了如下技术方案:
一种基于多任务学习的加密流量分类系统,包括以下步骤:
S1:将采集到的带标签的加密流量数据按双向流分割,每条双向流的数据作为一个训练样本;
S2:提取所述训练样本的时间序列特征:数据包的到达间隔时间、数据包长度、数据包方向;
S3:生成多任务分类模型的辅助任务和主任务,主任务为流量的服务类型分类,辅助任务包括流量的带宽分类和持续时间分类,并设计辅助任务的类别划分器,为每条流量数据添加对应的辅助任务标签;
S4:构建基于软参数共享机制的多任务分类模型,基于软参数共享机制的多任务分类模型有浅层共享层和特定任务层两层,浅层共享层主要用于设置专家网络,特定任务层用于设置门控网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211166951.7/2.html,转载请声明来源钻瓜专利网。





