[发明专利]用于在企业网络中检测异常主机的机器学习系统有效
申请号: | 201611144494.6 | 申请日: | 2016-12-13 |
公开(公告)号: | CN106790008B | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 冯望烟;吴淑宁;张立钢 | 申请(专利权)人: | 浙江中都信息技术有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06N3/08 |
代理公司: | 北京中誉威圣知识产权代理有限公司 11279 | 代理人: | 蒋常雪 |
地址: | 312000 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 企业 网络 检测 异常 主机 机器 学习 系统 | ||
1.一种用于在企业网络中检测异常主机的机器学习系统,其特征在于:所述机器学习系统包括数据收集子系统、数据处理子系统、三阶段机器学习子系统和标记报警子系统,所述四个子系统顺次衔接,所述数据收集子系统收集到企业网络中各类与安全相关的信息之后,传递给所述数据处理子系统,所述数据处理子系统对数据进行标准化处理和特征提取处理后,将提取的特征向量传递给所述三阶段机器学习子系统,将异常主机的信息传递给所述标记报警子系统,所述标记报警子系统对异常主机进行标记,根据预先确定的报警策略,对达到报警要求的异常主机和安全事件进行报警,供安全处理中心进行安全审计;
其中,所述数据收集子系统用于收集与企业网络相关的所有安全日志数据,包括结构化数据、半结构化数据和/或非结构化数据;
所述数据收集子系统包括若干个数据代理和一个数据解析模块,每个数据代理负责从对应的应用系统中收集安全相关的数据,数据解析模块负责对各数据代理收集的安全数据进行处理和解析,并将解析结果传递给所述数据处理子系统;
其中,所述数据处理子系统包括IP/主机映射模块、数据标准化处理模块和特征向量提取模块;所述IP/主机映射模块依据所述数据收集子系统传递过来的安全日志数据,实现IP地址与主机之间的相互映射,生成主机级别的视图;所述数据标准化处理模块按照事先设定的处理规则,对由所述IP/主机映射模块传递过来的数据进行标准化处理,保证数据的一致性和准确性;所述特征向量提取模块针对所述主机视图中的每台主机和/或服务器,根据所获得的安全数据,生成反映主机安全状态的特征向量,其中,每项特征数据构成特征向量的一个特征项;
其中,所述三阶段机器学习子系统包括三个相互衔接的学习阶段,第一阶段采用多个无监督学习结果的汇总修正,这一阶段利用地理空间信息来检测异常,并为第二阶段的学习生成标签;第二阶段采用贝叶斯学习,结合隐马尔可夫模型,利用主机的时间信息,为第三阶段的学习生成标签;第三阶段是深层神经网络DNN学习,利用空间信息检测异常;所述第二阶段学习和第三阶段学习使用监督学习并相互更新,用第二阶段学习的输出作为第三阶段学习的输入,将第三阶段学习的输出反馈给第二阶段学习作为输入,进行迭代运算。
2.根据权利要求1所述的一种用于在企业网络中检测异常主机的机器学习系统,其特征在于:所述数据收集子系统可以利用企业现有的SIEM系统实现。
3.根据权利要求1所述的一种用于在企业网络中检测异常主机的机器学习系统,其特征在于:所述特征向量提取模块采用两种格式来整理每台主机和服务器的特征数据:
第一种格式是时间序列列表,此表中列出所有事件信息,表中的条目按主机和事件日期排列,对于一个特定的主机,它按照时间顺序列出,这种格式的特征数据将会提供给所述第二阶段学习的HMM模型使用,作为其输入数据;
第二种数据格式是主机特征向量列表,对于每个主机或服务器,根据所述数据收集子系统所获取的事件信息,生成该主机的原始特征向量,并将企业网络中包含的所有主机或服务器的原始特征向量汇集在一起形成主机特征向量列表,表中每一行代表一个主机的特征向量,表中每一列代表一个特征项,其对应于一个安全数据收集项目,这种格式的特征数据将会提供给所述第一阶段无监督学习和所述第三阶段的DNN学习者模型使用,作为其输入数据。
4.根据权利要求1所述的一种用于在企业网络中检测异常主机的机器学习系统,其特征在于:所述第一学习阶段运用不同类型的无监督学习方法,并整合修正每个方法的结果;本阶段包括无监督学习模块、排名模块和整合模块,所述无监督学习模块接收所述数据处理子系统传递过来的特征向量,进行无监督学习后将结果传递给所述排名模块,所述排名模块根据各种无监督学习算法所得分值对主机进行排名并将排名结果传递给所述整合模块,所述整合模块根据所接收的主机排名信息,结合预先设定的判定规则,判定各主机的状态为异常或非异常,对判定为异常的主机进行标记,并将标记结果递交给所述第二学习阶段的HMM模型,作为其输入数据;
在第一学习阶段可以使用基于PCA和SVD方法的矩阵、基于Coupla的概率密度函数、基于图论的页排名方法,以及基于RNN的神经网络来检测异常。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江中都信息技术有限公司,未经浙江中都信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611144494.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:烟气脱硫脱硝除尘塔
- 下一篇:一种脱硫吸收塔用托盘装置及脱硫吸收塔