[发明专利]结合混合随机森林的关键信息基础设施资产识别方法有效
申请号: | 201910459868.0 | 申请日: | 2019-05-30 |
公开(公告)号: | CN110245693B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 罗森林;门元昊;潘丽敏;陈传涛;秦枭喃 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F18/2431 | 分类号: | G06F18/2431;G06F18/2411;G06Q10/0639;G06Q50/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 混合 随机 森林 关键 信息 基础设施 资产 识别 方法 | ||
本发明公开了一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。该方法包括:对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;结合德尔菲专家咨询法和主成分分析法,进行资产设施的关键影响因素分析,提取关键特征向量;将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。由于本发明提供的关键信息基础设施资产识别方法,在大数据下通过结合机器学习方法实现资产的特征构建和关键因素提取,通过分区构建各自的专家模型,提升识别的准确性和效率,并提高了模型的泛化能力和可扩展性。
技术领域
本发明涉及一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。
背景技术
关键信息基础设施在国民经济和社会发展中具有举足轻重的地位,是重要的国家战略资产。因此,很多国家都十分重视对关键信息基础设施的保护,而识别认定该流量是否为关键信息基础设施是对其进行安全保护的前提,同时也是实践中的难点之一。目前为止,业界对于关键信息基础设施的识别方法,主要是基于人为标定或规则匹配的识别认定方法,取得了一定的成果,但也存在这较多问题。
1.基于人为标定的识别认定方法
基于人为标定的识别认定算法在关键信息基础设施定义模糊、分类标准较为宏观的时期应用较多。这一方法借助了主观评价的手段,能够减轻关键信息基础设施定义模糊对识别认定的负面影响。但是这种方法的泛化能力较弱,且效率低。
2.基于规则匹配的识别认定方法
规则匹配是人为标定方法的改进。根据已知关键信息基础设施的通信协议、IP、端口、域名等重要信息生成规则,再根据已有的规则对未知设施进行识别认定。这一方法能够实现对资产的自动化识别,提高了识别效率。但是由于识别规则的固定,此方法依然存在泛化能力差、识别准确率低的问题。
3.结合混合专家模型的识别认定方法
混合专家模型能够根据已有的关键信息基础设施数据分离训练多个识别模型,并通过门控模块对各个模型进行取舍,最后的输出为各模型的加权组合。该方法具有较强的泛化能力,且识别准确率也高于前两种方法。
综上所述,由于关键信息基础设施资产数量大、种类多,基于人为标定或规则匹配的识别认定方法无法对关键信息基础设施资产进行快速、全面、准确的识别认定。因此,本发明将提供结合混合随机森林的关键信息基础设施资产识别方法,来提高关键信息基础设施资产识别的准确率。
发明内容
本发明的目的是为多种类、大数量条件下快速、准确识别认定此流量数据是否是关键信息基础设施资产的问题,提出结合混合随机森林的关键信息基础设施资产识别认定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910459868.0/2.html,转载请声明来源钻瓜专利网。