[发明专利]一种HTTP访问行为的识别方法及装置在审
| 申请号: | 201811421189.6 | 申请日: | 2018-11-26 |
| 公开(公告)号: | CN109274698A | 公开(公告)日: | 2019-01-25 |
| 发明(设计)人: | 郭鹏;范渊;龙文洁 | 申请(专利权)人: | 杭州安恒信息技术股份有限公司 |
| 主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/08 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
| 地址: | 310000 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征值集合 访问行为 粗糙集理论 访问数据 分类结果 误差率 可读存储介质 离散化处理 数据处理量 模糊 技术效果 冗余数据 识别装置 特征数据 提取特征 准确率 删除 筛选 输出 | ||
本发明公开了一种HTTP访问行为的识别方法,包括:获取WEB服务器中的访问数据,从访问数据中筛选出符合HTTP协议的数据;从符合HTTP协议的数据中提取特征数据,并对提取到的特征数据进行离散化处理,得到特征值集合;根据模糊粗糙集理论处理特征值集合,得到目标特征值集合;将目标特征值集合输入SVM模型,并输出分类结果,并根据分类结果确定HTTP访问行为。基于模糊粗糙集理论处理特征值集合,可删除其中的冗余数据,从而减少SVM模型中的数据处理量,提高了访问行为的识别效率和准确率,降低误差率。相应地,本发明公开的一种HTTP访问行为的识别装置、设备及可读存储介质,也同样具有上述技术效果。
技术领域
本发明涉及计算机技术领域,更具体地说,涉及一种HTTP访问行为的识别方法、装置、设备及可读存储介质。
背景技术
网络中的访问行为对于网络系统的安全、可靠、稳定的运行具有非常重要的意义,因此需要及时准确地检测并确定服务器中的访问请求的行为。
在现有技术中,一般基于人工设置的匹配规则确定访问请求的访问行为,但由于该方法需要人工修改匹配规则,且检测识别的准确性和效率均不尽如人意,因此被机器学习算法所替代。常用的机器学习算法为基于朴素贝叶斯分类算法和人工神经网络算法,但这些算法在处理大量数据时,处理效率和准确性均比较缓慢,误差率也较高。
因此,如何提高访问行为的识别效率和准确率,降低误差率,是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供一种HTTP访问行为的识别方法、装置、设备及可读存储介质,以提高访问行为的识别效率和准确率,降低误差率。
为实现上述目的,本发明实施例提供了如下技术方案:
一种HTTP访问行为的识别方法,包括:
获取WEB服务器中的访问数据,从所述访问数据中筛选出符合HTTP协议的数据;
从所述符合HTTP协议的数据中提取特征数据,并对提取到的特征数据进行离散化处理,得到特征值集合;
根据模糊粗糙集理论处理所述特征值集合,得到目标特征值集合;
将所述目标特征值集合输入SVM模型,并输出分类结果,并根据所述分类结果确定HTTP访问行为。
其中,所述对提取到的特征数据进行离散化处理,包括:
基于访问时间、访问IP、站点名称、访问方式、访问结果、响应码和浏览器类型、操作系统类型对提取到的特征数据进行离散化处理。
其中,所述根据模糊粗糙集理论处理所述特征值集合,包括:
计算所述特征值集合中每个特征值属性的权重值,并根据所述权重值删减所述特征值集合。
其中,所述根据所述权重值删减所述特征值集合,包括:
将权重值低于预设阈值的特征值属性对应的特征值删除。
其中,所述根据所述分类结果确定HTTP访问行为,包括:
确定每种分类结果的特征,并将具有攻击特征的分类结果确定为异常访问行为;其中,所述攻击特征至少包括:DOS攻击、Probe攻击、R2L攻击和U2R攻击。
一种HTTP访问行为的识别装置,包括:
获取模块,用于获取WEB服务器中的访问数据,从所述访问数据中筛选出符合HTTP协议的数据;
提取模块,用于从所述符合HTTP协议的数据中提取特征数据,并对提取到的特征数据进行离散化处理,得到特征值集合;
处理模块,用于根据模糊粗糙集理论处理所述特征值集合,得到目标特征值集合:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术股份有限公司,未经杭州安恒信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811421189.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据帧转义方法、系统及相关装置
- 下一篇:鉴权方法、装置、服务器及存储介质





