[发明专利]大数据环境下WEB异常检测方法、系统及服务器有效
| 申请号: | 201811257486.1 | 申请日: | 2018-10-26 |
| 公开(公告)号: | CN109508542B | 公开(公告)日: | 2019-11-22 |
| 发明(设计)人: | 马旸;蔡冰;罗雅琼;姚力 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心江苏分中心 |
| 主分类号: | G06F21/55 | 分类号: | G06F21/55;G06F1/20;G06F11/30;G06F16/955 |
| 代理公司: | 32224 南京纵横知识产权代理有限公司 | 代理人: | 董建林<国际申请>=<国际公布>=<进入 |
| 地址: | 210000 江苏省南京市建*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 逻辑回归模型 异常检测 大数据 服务器 过滤 规则匹配 入侵检测 漏报率 向量化 构建 误报 响应 | ||
1.大数据环境下WEB异常检测方法,其特征在于:包括以下步骤,
正常URL逻辑回归模型构建,具体过程为:
101)采用N-Gram模型,获取正常URL里的关键词列表;
102)采用TfidfVectorizer函数把每个正常URL里的关键词做TF-IDF,得到向量化的特征;
103)训练正常URL逻辑回归模型;
异常检测,具体过程为:
通过训练好的正常URL逻辑回归模型,过滤HTTP请求,若HTTP请求中的URL为正常URL,则响应HTTP请求。
2.根据权利要求1所述的大数据环境下WEB异常检测方法,其特征在于:还包括异常URL逻辑回归模型构建,具体过程为:
201)采用N-Gram模型,获取异常URL里的关键词列表;
202)采用TfidfVectorizer函数把每个异常URL里的关键词做TF-IDF,得到向量化的特征;
203)训练异常URL逻辑回归模型。
3.根据权利要求2所述的大数据环境下WEB异常检测方法,其特征在于:异常检测的具体过程为,
301)通过正常URL逻辑回归模型判断HTTP请求中的URL,若为正常URL,则响应HTTP请求;若无法判定为正常URL,则转至302;
302)通过异常URL逻辑回归模型判断HTTP请求中的URL,若判定为异常URL,则阻断该请求;若无法判定为异常URL,则转至303;
303)对HTTP请求中的URL进行人工判断;若为正常URL,则响应HTTP请求,并将其放入正常URL逻辑回归模型训练集合,并对正常URL逻辑回归模型重新训练;若为异常URL,则阻断该请求,并将其放入异常URL逻辑回归模型训练集合,并对异常URL逻辑回归模型重新训练。
4.根据权利要求1或2所述的大数据环境下WEB异常检测方法,其特征在于:N-Gram模型分割URL得到一系列字符串,对字符串进行Gram切分,得到关键词列表。
5.大数据环境下WEB异常检测系统,其特征在于:包括正常URL逻辑回归模型构建模块和过滤模块;
正常URL逻辑回归模型构建模块包括,
正常URL关键词列表获取模块:采用N-Gram模型,获取正常URL里的关键词列表;
正常URL特征模块:采用TfidfVectorizer函数把每个正常URL里的关键词做TF-IDF,得到向量化的特征;
正常URL逻辑回归模型训练模块:训练正常URL逻辑回归模型;
异常检测模块:通过训练好的正常URL逻辑回归模型,过滤HTTP请求,若HTTP请求中的URL为正常URL,则响应HTTP请求。
6.根据权利要求5所述的大数据环境下WEB异常检测系统,其特征在于:还包括异常URL逻辑回归模型构建模块包括,
异常URL关键词列表获取模块:采用N-Gram模型,获取异常URL里的关键词列表;
异常URL特征模块:采用TfidfVectorizer函数把每个异常URL里的关键词做TF-IDF,得到向量化的特征;
异常URL逻辑回归模型训练模块:训练异常URL逻辑回归模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心江苏分中心,未经国家计算机网络与信息安全管理中心江苏分中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811257486.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于语义分析的可信行为库生成方法
- 下一篇:一种数据安全监测与处理装置





