[发明专利]加密流量检测模型的训练方法、装置、设备及存储介质在审
| 申请号: | 202210980514.2 | 申请日: | 2022-08-16 |
| 公开(公告)号: | CN115529159A | 公开(公告)日: | 2022-12-27 |
| 发明(设计)人: | 段赟;刘东鑫;汪来富;董浩 | 申请(专利权)人: | 中国电信股份有限公司 |
| 主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L41/16;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 加密 流量 检测 模型 训练 方法 装置 设备 存储 介质 | ||
本发明提供了加密流量检测模型的训练方法、装置、设备及存储介质,该方法包括:获取流量样本数据,所述流量样本数据包括流量数据以及流量数据的分类标签;对所述流量数据进行预处理,获得第一样本集合以及第二样本集合;将所述第一样本集合和所述第二样本集合中的多个样本数据包转换为第一图像;将所述第二样本集合输入生成对抗网络模型中,所述生成对抗网络模型的生成器基于所述第二样本集合生成第二图像;将所述第二图像和所述第一图像,输入至分类器中,获得分类器输出的分类结果;根据所述分类器输出的分类结果与所述分类标签的比较,调整所述分类器的参数。本发明避免加密流量检测任务中样本不平衡造成的应用效果不佳。
技术领域
本发明涉及流量检测领域,具体地说,涉及加密流量检测模型的训练方法、装置、设备及存储介质。
背景技术
人工智能(AI)算法在网络安全领域中极具前景,应用广泛,其中有监督学习的算法占据了绝大部分。而无论是传统的机器学习算法,如逻辑回归、SVM(支持向量机)、NN(神经网络),还是近年所流行的深度学习算法,如CNN(卷积神经网络)、RNN(循环神经网络)等,这些有监督学习算法的实际表现都依赖于训练样本的质量,包括不同类别样本的平衡性、训练样本和实际应用场景的匹配性等。
加密流量的检测包括加密/非加密流量的分类、加密流量种类的分类等,加密流量的检测对于网络安全的相关任务具有一定的基础性作用。而在加密流量检测的实际应用场景中,容易出现训练样本不平衡的情况,这种训练样本不平衡的情况,极大制约了AI类算法在网络安全领域的实际应用效果。
由此,如何避免加密流量检测任务中样本不平衡造成的应用效果不佳,是本领域技术人员亟待解决的技术问题。
需要说明的是,上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
针对现有技术中的问题,本发明的目的在于提供加密流量检测模型的训练方法、装置、设备及存储介质,克服了现有技术的困难,避免加密流量检测任务中样本不平衡造成的应用效果不佳。
本发明的实施例提供一种加密流量检测模型的训练方法,包括:
获取流量样本数据,所述流量样本数据包括流量数据以及流量数据的分类标签;
对所述流量数据进行预处理,获得第一样本集合以及第二样本集合,其中,所述第一样本集合包括多个第一样本数据包,所述第二样本集合包括多个第二样本数据包,所述第一样本集合中的第一样本数据包的数量大于所述第二样本集合的所述第二样本数据包的数量;
将所述第一样本集合和所述第二样本集合中的多个样本数据包转换为第一图像;
将所述第二样本集合输入生成对抗网络模型中,所述生成对抗网络模型的生成器基于所述第二样本集合生成第二图像,所述生成对抗网络模型的判别器用于识别所述第二图像与对应的所述第一图像的差异;
将所述第二图像和所述第一图像,输入至分类器中,获得分类器输出的分类结果;
根据所述分类器输出的分类结果与所述分类标签的比较,调整所述分类器的参数。
在本申请的一些实施例中,所述生成对抗网络模型的生成器以所述生成对抗网络模型的判别器将所述第二图像识别为对应的第一图像的概率大于设定阈值为目标进行训练。
在本申请的一些实施例中,所述生成器用于向所述第二样本集合中的多个第二样本数据包增加随机噪声,以生成第二图像。
在本申请的一些实施例中,所述对所述流量数据进行预处理包括:
将第一流量数据和第二流量数据分别按会话层切分为多个第一样本数据包和多个第二样本数据包;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210980514.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本处理方法、装置、设备及介质
- 下一篇:一种艾灸设备





