[发明专利]一种基于欺骗性防御的未知威胁自适应检测方法在审

申请号：	202310238699.4	申请日：	2023-03-13
公开（公告）号：	CN116192530A	公开（公告）日：	2023-05-30
发明（设计）人：	丁旭阳;刘子为;谢盈;韩幸;张小松	申请（专利权）人：	电子科技大学
主分类号：	H04L9/40	分类号：	H04L9/40;G06F18/23
代理公司：	电子科技大学专利中心 51203	代理人：	周刘英
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于欺骗性防御未知威胁自适应检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于欺骗性防御的未知威胁自适应检测方法，其特征在于，该方法采用基于欺骗性防御技术的未知威胁自适应流量检测系统实现，该系统在现有局域网中部署方式为：工控设备、路由器、交换机为已经存在的设备，网关服务器和蜜罐设备搭载所述自适应流量检测系统；所述自适应流量检测系统中的恶意流量检测模块和自适应检测升级模块部署在网关服务器中，各个蜜罐设备搭载所述自适应流量检测系统的蜜罐模块，能够将捕获的攻击流量反馈给网关服务器，同时各个蜜罐设备具备已存在的欺骗性防御技术，能够对未知威胁进行引导和捕获；工业控制网络中部署一个及以上的蜜罐设备，所述自适应流量检测系统中的恶意流量检测模块通过现有的神经网络模型进行威胁检测，自适应检测升级模块通过重新训练神经网络模型的方式，实现对恶意流量检测模块的升级和更新；

该方法包括以下步骤：

S1、使用恶意流量检测模块对蜜罐模块捕获的威胁流量进行分析，获取未知威胁流量，将未知威胁流量制作为预处理数据集D_pre，同时将恶意流量检测模块最初携带的数据集记为原始数据集D_org；

S2、将预处理数据集D_pre和原始数据集D_org进行合并，得到合并数据集D_cbn^*，对合并数据集D_cbn^*进行样本空间的聚类，得到聚类后的数据集D_cbn，并确定数据集D_cbn中的少数类和多数类的划分；

下面是对合并数据集D_cbn^*进行聚类的公式和聚类后的数据集D_cbn过程：

在进行聚类操作前，D_cbn^*由两个部分组成D_org和D_pre；D_cbn中原属于D_org的样本点，具有完备的类簇标识集合C_old，其中，表示第k类中心点位置，k＝1,2,…,S，原始数据集中含有的类别总数为S，D_cbn中原属于D_pre的样本点，均作为独立类簇；通过如下公式完成D_cbn^*的聚类，并得到D_cbn中新的类簇标识集合C_new，采用如下公式计算D_cbn^*所有类簇之间的距离，如果小于预先设定的阈值η，则将两个类簇合并；

类簇距离计算公式如下：

其中，C_a和C_b表示两个任意类簇，x,y分别为C_a和C_b中的样本点，|C_a|和|C_b|表示类簇中样本总数，如果d(C_a,C_b)小于η则将两个类簇进行合并，重复到无法合并为止，新得到的若干类簇按照样本数量，从大到小排序新的类簇有N个，自此得聚类后的数据集D_cbn；

通过计算流程可知，新的样本点被聚合到两个地方，第一个是已有的S个类别中，第二个是形成新的类别，由于未知威胁样本数量少的特点，前S个已知类别为多数类，后N-S个类别为少数类，其中未知威胁集中在少数类中；

S3、对聚类后的数据集D_cbn，通过样本空间中近邻少数类的平均距离d_sa和近邻多数类的个数N_ma，度量其中少数类样本的学习复杂度ld；

针对某个少数类C_i，邻近少数类平均距离计算过程如下，其中，C_i为集合集中的某个类，i的取值范围为S+1到N的整数：

C_i与m个邻近少数类的平均距离为C_i的邻近少数类平均距离，表示该类样本在少数类空间的稀疏程度，其中，m为预先设置的常数，m个邻近少数类表示C_i与所有少数类的距离从小到大进行排序的前m个少数类；

针对某个少数类C_i，局部近邻多数类个数计算过程如下：

C_i与第m个近邻少数类的距离为半径，所形成的圆中多数类样本的个数为表示C_i的局部近邻多数类个数；

近邻少数类平均距离的值越大表示少数类样本空间分布很稀疏，这类样本很难进行学习，则应该赋予更高的学习权重；反之越密集，则越容易进行学习，学习的复杂度越低；

局部近邻多数类个数的值越大表示该类样本处于多数样本类的边界或者中心区域，那么该类的学习成本会很高，因为该类样本会受到多数样本类的影响，反之则学习复杂越低，越容易进行学习；

近邻少数类平均距离归一化计算公式如下：

其中，j的取值为S+1到N的正整数，表示第j个少数类的近邻少数类平均距离，表示第i个少数类的近邻少数类平均距离归一化后的值；

局部近邻多数类个数归一化公式如下：

表示第j个局部近邻多数类个数，表示第i个局部近邻多数类个数归一化后的值；

则对于少数类C_i的学习复杂度ld_i计算公式如下：

其中α表示加权系数，为平衡近邻少数类平均距离和局部近邻多数类个数的关系；学习复杂度ld_i越大，表示该样本类C_i越难进行学习，需要生成更多的邻近样本；

S4、对聚类后的数据集D_cbn，根据学习复杂度ld，计算少数类样本合成数目，通过合成公式生成新的少数类样本，将生成的少数类样本合并入D_cbn，形成新的样本数据集D_nrb，数据集D_nrb中样本空间趋于平衡；

针对某个少数类C_i，生成样本数目的计算公式如下：

其中为生成的样本数目，M_i表示第i类样本数目，即样本类C_i的数目，M_max为最大样本数目，是数据集D_cbn中样本最多类别的样本数目，即类别中样本数量；

针对某个少数类C_i，生成样本点的公式如下：

x_new＝x_p+rand(0，1)×(x_q-x_p)

其中，x_new是合成的新的样本数据，x_p为少数类簇C_i的中心点的坐标向量，每个少数类的的中心点只有一个，x_q为少数类簇C_i中随机的一个样本点的坐标向量，p为自然数，q为1到|C_i|中的随机整数，|C_i|表示类簇C_i中样本总数，使用该公式生成个样本点，并将新生成的样本点加入到少数类C_i中，此时C_i完成样本平衡；

将以上过程作用到数据集D_cbn的每个少数样本类，完成数据集D_cbn整体的样本平衡，得到新的数据集D_nrb；

S5、使用数据集D_nrb对神经网络模型重新进行训练，通过自适应流量检测系统中的自适应检测升级模块，将重新训练的神经网络模型更新到恶意流量检测模块中，自此，自适应流量检测系统自动化更新完成，能够对局域网中的未知威胁流量进行检测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202310238699.4/1.html，转载请声明来源钻瓜专利网。

上一篇：一种三电平电压恢复器带不平衡负载的控制系统和方法
下一篇：一种机械加工制造用切削液自动喷射装置

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L9-00 保密或安全通信装置
H04L9-06 .使用移位寄存器或存储器用于块式码的密码装置，例如dES系统
H04L9-10 .带有特殊机体，物理特征或人工控制
H04L9-12 .同步的或最初建立特殊方式的发送和接收密码设备
H04L9-14 .使用多个密钥或算法
H04L9-18 .用串行和连续修改数据流单元加密，例如数据流加密系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于欺骗性防御的未知威胁自适应检测方法在审

专利文献下载