[发明专利]一种基于GAN的不平衡网络入侵数据检测系统及其方法在审
申请号: | 202211103734.3 | 申请日: | 2022-09-09 |
公开(公告)号: | CN116318762A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 张传雷;刘江涛;李建荣;可婷;张勇进;陈伟;孙迪;丁忠林 | 申请(专利权)人: | 天津科技大学;天津市多智信息科技有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L41/16;G06N3/0475;G06N3/045;G06N3/094;G06N3/0455 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 300000 天津市滨*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gan 不平衡 网络 入侵 数据 检测 系统 及其 方法 | ||
1.一种基于GAN的不平衡网络入侵数据检测系统,其特征在于,包括:GAN-DAE模型、结果输出模块和评价模块;
所述GAN-DAE模型包括生成器和鉴别器;
所述生成器中的深度自编码器DAE至少依次包括第一编码器、第一解码器和第二编码器;
所述第一编码器,用于接收输入样本X并进行第一次编码得到编码后结果Z,并将Z发送至所述第一解码器;
所述第一解码器,用于接收Z并进行解码得到解码后结果X’,并将X’发送至所述第二编码器和所述鉴别器;
所述第二编码器,用于接收X’并进行第二次编码得到编码后的结果Z’;
所述鉴别器,用于接收X和X’,并判断X’是否为正常样本;
所述训练模块,用于控制生成器和鉴别器进行相互对抗,优化生成器和鉴别器的代价函数,直至生成器损失最小化,即鉴别器损失最大化;
所述误差计算模块:计算将X’视为正常样本的误差、X与X’之间的误差、以及Z与Z’之间的误差;
所述结果输出模块,用于根据误差计算模块计算出的误差值的大小来识别待检测数据中是否存在异常;若误差值小于预设阈值,则输出不存在异常结果,若误差值大于预设阈值,则输出存在异常结果;
所述评价模块,用于根据评价指标来评价训练好的所述GAN-DAE模型的性能。
2.根据权利要求1所述的一种基于GAN的不平衡网络入侵数据检测系统,其特征在于,生成器和鉴别器进行相互对抗的过程为:
其中p(z)表示编码后结果Z的分布,p(x)表示输入数据X的分布,D(x)表示数据X来自真实数据分布。
3.根据权利要求1所述的一种基于GAN的不平衡网络入侵数据检测系统,其特征在于,所述误差计算模块中的损失函数分别为:
计算将X’作为输入样本时的误差:
计算X与X’之间的误差:
计算Z与Z’之间的误差:
其中,g表示二元交叉损失函数,C(X′)表示鉴别器将X′看作真实样本的概率,α为1。
4.根据权利要求1所述的一种基于GAN的不平衡网络入侵数据检测系统,其特征在于,所述评价指标包括:准确率、精确率、召回率和F1分数;
准确率表示预测正确的样本占总样本的比例,计算方法为:
Accuracy=(TP+TN)/(TP+FN+FP+TN)
准确率取值范围为[0,1],准确率取值越大,模型效果越好;
精确率表示模型预测为正的所有情况中,预测为正的情况占比,计算方法为:
Precision=TP/(TP+FP)
精确率取值范围是[0,1],精确率值越接近于1,表示模型预测能力越好;
召回率表示在所有正样本中,模型预测为正的情况占比,计算方法为:
Recall=TP/(TP+FN)
召回率取值范围为[0,1],召回率的值越大,表示模型的预测能力越好;
F1分数的值越大,表示模型的预测能力越好,计算方法为:
F1=2*Precison*Recall/(Precision+Recall)
其中,TP表示真实值为正,预测值也为正,即预测完全正确;TN表示真实值为负,预测值也为负,即预测完全正确;FP表示真实值为负,但是预测值却为正,即预测错误,称为第一类错误;FN表示真实值为正,预测值却为负,即预测错误,称为第二类错误。
5.一种基于GAN的不平衡网络入侵数据检测方法,基于权利要求1-4任意一项所述的一种基于GAN的不平衡网络入侵数据检测模型,其特征在于,包括以下步骤:
将待检测数据输入至训练好的GAN-DAE模型中,所述GAN-DAE模型根据误差计算模块得到的误差值的大小来识别待检测数据中是否存在异常;若误差值小于预设阈值,则输出不存在异常结果,若误差值大于预设阈值,则输出存在异常结果;
所述GAN-DAE模型的训练过程为:
S1.将正常样本数据进行预处理,并划分为训练集和测试集;
S2.对所述训练集中的样本数据X进行第一次编码得到编码后结果Z;
S3.对Z进行解码得到解码后结果X’;
S4.对X’并进行第二次编码得到编码后的结果Z’;
S5.根据误差计算模块分别计算将X’作为正常样本的误差、输入样本X与X’之间的误差、以及Z与Z’之间的误差;
S6.循环S2-S5,循环的过程中对生成器和鉴别器进行相互对抗,优化生成器和鉴别器的代价函数,直至生成器损失最小化,即鉴别器损失最大化;
S7.通过所述测试集对训练后的GAN-DAE模型进行测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津科技大学;天津市多智信息科技有限公司,未经天津科技大学;天津市多智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211103734.3/1.html,转载请声明来源钻瓜专利网。