[发明专利]基于高维扩展关键特征向量的网络恶意流量识别方法在审
申请号: | 202011090699.7 | 申请日: | 2020-10-13 |
公开(公告)号: | CN112422505A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 罗森林;张睿智;潘丽敏;陈传涛 | 申请(专利权)人: | 北京理工大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 扩展 关键 特征向量 网络 恶意 流量 识别 方法 | ||
本发明涉及基于高维扩展关键特征向量的网络恶意流量识别方法,属于计算机与信息科学技术领域。本发明首先对网络流量数据进行数据清洗和特征优化表达,采用特征分割与融合的方法从关键字、时段节点、行为组合三个方面构建特征,并进行归一化和标准化处理,获得关键词特征向量、时段特征向量、行为特征向量,顺序拼接获得高维扩展特征向量;然后结合专家调查法和因子分析法,进行关键影响因素分析,得到特征权重集,剔除冗余特征和混淆特征,提取关键特征向量;最后,对训练好的决策树进行AUC值计算和相似度计算,保留效果最好的决策树构建随机森林模型,实现对网络恶意流量的自动化识别和检测。
技术领域
本发明涉及基于高维扩展关键特征向量的网络恶意流量识别方法,属于计算机与信息科学领域。
背景技术
随着互联网的迅速发展,给我们的生活和工作带来了方便,但随之而来的是网络入侵攻击事件频发,网络安全问题日益凸显,因此事前对恶意行为进行主动检测、及时发现异常攻击就显得尤为重要。传统的恶意流量识别方法比较简单,无法满足现在复杂的网络环境和网络攻击手段,导致识别效率低,误报率高。因此,本发明将提供基于高维扩展关键特征向量的网络恶意流量识别方法,来提高恶意流量识别的准确率和时间效率。
1.基于专家经验的识别方法
基于经验的识别方法主要依赖于专家对恶意流量的判断和认定,但由于恶意行为种类繁多、特征复杂的客观因素,工作人员往往难以做出准确识别,且存在较大的主观影响因素,容易出现漏报、误报的情况。
2.基于统计分析的识别方法
基于统计分析的识别方法是根据用户行为或资源使用状况的正常程度来判断是否为恶意行为,通过构建统计模型得出正常行为轮廓,选择统计参数和参数阈值,超过阈值范围即认为是恶意行为。但这种方法灵活性差,误报率高,且一般以批处理方式来分析测量数据记录,无法反映事件时间关联性特征,局限性较大。
3.基于规则匹配的识别方法
基于规则匹配的识别方法是将收集到的信息与建立好的规则知识库进行比对,如果其特征信息与特征库的信息匹配,则说明有恶意行为。但当网络中出现新的恶意行为和攻击方法时需要升级更新知识库,也无法检测出变种攻击和攻击方法未知的恶意流量,泛化能力差。
综上所述,由于近年来的恶意流量数量大、种类多,基于人为标定或规则匹配的识别方法无法对恶意流量进行快速、准确的识别。因此,本发明将提供基于高维扩展关键特征向量的网络恶意流量识别方法,来提高恶意流量识别的准确率和泛化性。
发明内容
本发明的目的是针对复杂环境中大数量、多种类网络流量,快速、准确检测出此流量是否有恶意行为的问题,提出基于高维扩展关键特征向量的网络恶意流量识别方法。
本发明的设计原理为:首先,对网络流量数据进行数据清洗和特征优化表达,采用特征分割与融合的方法从关键词、时段节点、行为组合三个方面构建特征,并进行归一化和标准化处理,获得关键词特征向量、时段特征向量、行为特征向量,顺序拼接获得高维扩展特征向量;然后结合专家调查法和因子分析法,进行关键影响因素分析,得到特征权重集,剔除冗余特征和混淆特征,提取关键特征向量;最后,对训练好的决策树进行AUC值计算和相似度计算,保留效果最好的决策树构建随机森林模型,实现对网络恶意流量的自动化识别和检测。
本发明的技术方案是通过如下步骤实现的:
步骤1,对采集到的网络流量数据进行特征优化表达和特征构建,得到扩展特征向量。
步骤1.1,对数据进行异常值剔除、空缺值补全和数据标准化处理。
步骤1.2,采用特征分割与融合的方法,以关键字、时段节点、行为组合三个方面为基准构建特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011090699.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:超晶格材料和应用
- 下一篇:无人船无线通信方法、无人船通信系统及通信基站