[发明专利]一种基于协同训练的Web攻击检测方法有效

专利信息
申请号: 201910239325.8 申请日: 2019-03-27
公开(公告)号: CN109831460B 公开(公告)日: 2021-03-16
发明(设计)人: 刘雪娇;唐旭栋;夏莹杰 申请(专利权)人: 杭州师范大学
主分类号: H04L29/06 分类号: H04L29/06
代理公司: 杭州浙科专利事务所(普通合伙) 33213 代理人: 吴秉中
地址: 311121 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 协同 训练 web 攻击 检测 方法
【权利要求书】:

1.一种基于协同训练的Web攻击检测方法,其特征在于包括以下步骤:

S1处理Web日志,构建数据集;

S2利用专家知识特征和文本特征,获得两个独立的视图;

S3利用两个独立的视图进行协同训练,获得两个分类器;

S4利用Stacking方法将两个分类器集成,得到Web攻击检测模型;

S5用Web攻击检测模型对Http请求进行攻击检测;

所述步骤S1中处理构建数据集的过程包括:

S11先从Web服务器中收集Web日志,再从中提取出URL,并对其进行解码,构成集合S;

S12随机从S中抽取|L|个样本,人工对样本进行标记,标签的集合为{-1,+1},-1代表是正常的URL,+1代表带有攻击的URL,标记样本构成集合L,未标记样本构成集合U,保证S=L+U,|L|<<|U|;

所述步骤S2中获得两个独立的视图的过程包括:

S21用专家知识特征构建视图:特征空间={路径长度,路径深度,参数长度,参数个数,参数名最大长度,参数名平均长度,参数值最大长度,参数值平均长度,参数值中字母占有的比例,参数之中数字占有的比例,参数值中特殊字符占有的比例,攻击关键字的个数},共计12个特征,用特征空间将URL向量化,S转化为视图X1,最后需要对X1进行归一化处理,公式为其中Xmax、Xmin分别是原始X1的最大值和最小值;

S22用文本特征构建视图:将URL看作文本,将URL转化为特征向量,S转化为视图X2,首先利用N-gram对URL进行分词,URL的特征空间是所有字符的组合,若S中有c种不同的字符,则URL向量的维度d=cn,其中n为N-gram中N的取值,之后用TF-IDF来计算URL的特征值,对于样本x第i个的特征值xi公式由以下的公式得出:xi=TFi×IDFi,其中ni、ntotal、nS、分别表示第i个特征在URL中出现的数量、URL分词后的总数、S的大小、有第i个特征的URL数量。

2.根据权利要求1所述的一种基于协同训练的Web攻击检测方法,其特征在于所述步骤S3中进行协同训练获得两个分类器的内容包括:

S31有标记样本集合无标记样本集合从Du中随机抽取s个样本构成缓冲池Ds,此时Du=Du-Ds,视图1的有标记样本集合视图2的有标记样本集合

S32用有监督学习算法通过来训练分类器m1,用有监督学习算法通过来训练分类器m2

S33遍历Ds,对于x∈Ds,若max m1(x)>θ,则将x加入其中mi(x)表示分类器mi对样本x是+1和-1的概率预测值,max mi(x)表示取其中最高的概率值,θ是人工设定的阈值,高于该阈值说明x具有高置信度,其中pi是带符号的预测概率值,作为x的伪标签,同理若max m2(x)>θ,则将x加入

S34用s1表示增加的数量,用s2表示增加的数量,保证s>>s1+s2,这是需要从Du中随机取s1+s2个样本加入Ds中;

S35重复S31到S34的步骤直到或者s1=s2=0,这表明集合U全部被标记完成或者分类器不再变化;

S36得到经过协同训练的两个分类器m1和m2

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910239325.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top