[发明专利]网络安全态势综合分析方法在审
申请号: | 202111553671.7 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114168948A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 田新远 | 申请(专利权)人: | 北京华清信安科技有限公司 |
主分类号: | G06F21/55 | 分类号: | G06F21/55;G06K9/62;G06N20/00 |
代理公司: | 北京汇智胜知识产权代理事务所(普通合伙) 11346 | 代理人: | 孙华 |
地址: | 100043 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络安全 态势 综合分析 方法 | ||
1.网络安全态势综合分析方法,其特征在于,包括以下步骤:
步骤一,采集安全云平台的安全日志数据,整理后作为数据分析样本;
步骤二,将所述数据分析样本提取特征后进行降维处理,然后利用数据关联分析技术进行关联关系分析,将所述数据分析样本基于业务访问类型进行分类并输出分类结果;
步骤三,根据步骤二的分类结果进行安全分析,建立规则识别数据库,预定义剧本进行用户行为识别;
步骤四,提取当前用户访问的请求数据,进行整理、特征提取以及降维处理后得待测数据,采用数据关联分析技术计算特征向量的相似度,获得所述待测数据的最相似样本,确定所述待测数据的类型;然后按照预定义剧本进行所述待测数据的行为识别;
步骤五,按照当前用户访问的业务类型、行为以及攻击类型,以图表形式将步骤四的行为识别结果进行呈现。
2.如权利要求1所述的网络安全态势综合分析方法,其特征在于,所述步骤二中采用分布式K-Means聚类算法对数据分析样本进行降维处理。
3.如权利要求2所述的网络安全态势综合分析方法,其特征在于,所述步骤二中所述数据关联分析具体包括:获取所述数据分析样本的相似度的特征变量,采用K近邻机器学习算法,计算所述数据分析样本中安全数据的相似度,采用欧式距离计算不同向量之间的距离,确定安全数据所归属的业务访问类型。
4.如权利要求1所述的网络安全态势综合分析方法,其特征在于,所述步骤四中,当最相似样本数量n大于1时,采用组合函数方式继续计算,所述组合函数方式具体为:
首先,采用均等投票方式,用N个最近邻中分类较多的分类作为所述待测数据的分类;
其次,采用权重投票方式,用N个最近邻进行投票,每个最近邻投票的权重不一样,权重值和最近邻与待测数据样本的距离成反比,距离越远,投票的权重越低,算出每个类别的加权票数,得票最多的类别为所述待测数据的分类结果。
5.如权利要求1所述的网络安全态势综合分析方法,其特征在于,步骤四所述待测数据的最相似样本通过下述步骤获得:
S401,获取待测数据的多个特征向量;
S402,计算待测数据和所述数据分析样本中安全数据多个特征向量的相似度,采用欧式距离计算不同向量之间的距离,计算公式如下:;其中相似度计算公式如下:
其中,L表示不同向量之间的距离,x、y分别表示向量距离。
S403,根据待测数据与数据库中安全数据的相似度,获得n个最相似样本。
6.如权利要求1所述的网络安全态势综合分析方法,其特征在于,所述步骤二中,采用分布式K-Means聚类算法对数据分析样本中的数据进行一次降维后,再利用主成分分析法进行二次降维。
7.如权利要求1所述的网络安全态势综合分析方法,其特征在于,所述步骤四还包括:所述待测数据先进行清洗和整理,然后利用StandardScaler进行预处理,使得所有数据的两个特征值都被转换到0-1之间。
8.如权利要求7所述的网络安全态势综合分析方法,其特征在于,所述清洗和整理包括:针对缺失值的处理,采用删除法对缺失值占比低,字段重要程度低的数据进行缺失值的删除,同时采用填充法的方式对缺失占比较高、数据分析重要性较高的字段进行填充,其中,数据填充引入自定义词典,对特定字段数据进行填充。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华清信安科技有限公司,未经北京华清信安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111553671.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种巡逻腰带
- 下一篇:一种注射器用免硅化橡胶塞及其制备方法