[发明专利]一种基于模糊集特征熵值计算的特征选择方法在审

专利信息
申请号: 201910914920.7 申请日: 2019-09-26
公开(公告)号: CN110689074A 公开(公告)日: 2020-01-14
发明(设计)人: 郭方方;孙思佳;赵天宇;吕宏武;冯光升;王瑞妮;王欣悦;何迪 申请(专利权)人: 哈尔滨工程大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 150001 黑龙江省哈尔滨市南岗区*** 国省代码: 黑龙;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 矩阵 计算复杂度 理想矢量 缩放因子 特征选择 计算相似度 安全数据 传统信息 取值空间 信息增益 模糊集 信息熵 减小 模糊 优化 分析
【说明书】:

发明属于安全数据分析领域,具体涉及一种基于模糊集特征熵值计算的特征选择方法。本发明主要包括计算理想矢量矩阵、计算相似度矩阵、计算特征的熵、计算缩放因子SFi,d、计算特征熵值排名SEd等步骤,本发明使用特征的缩放因子和特定类别之间的熵值来计算每个类别中理想矢量之间的距离,可以优化特征选择,降低计算复杂度。本发明方法采用模糊集中信息熵的计算方法FIEE来解决传统信息增益、信息增益比计算方法中,由于特征取值空间庞大而导致的无法计算的问题。本发明方法可以大大的减小计算复杂度。

技术领域

本发明属于安全数据分析领域,具体涉及一种基于模糊集特征熵值计算的特征选择方法。

背景技术

近年来,随着互联网用户数量的不断增加,网络安全也随之成为一个备受关注的话题。针对于对抗网络攻击者的恶意行为,入侵检测系统IDS是一种行之有效的方法,而决定IDS性能高低的决定因素是是否存在着一个对应的高效的且准确的分类模型,且如何针对安全分析数据集的特点,搭建合适的分类模型也成为该领域的研究热点。大量的冗余特征是安全分析数据的最大特点,在数据分析过程中不相关的特征会使得分类器出现混淆,不仅增加了模型复杂度同时降低了准确度,甚至可能导致过拟合。通过特征选择方法可以降低维数、降低计算复杂度、降低不相关特征带来的计算成本,在一定程度上减轻了冗余特征对分类模型带来的影响。因此,优化特征选择方法减小安全分析数据的冗余特征在识别检测恶意网络攻击过程中具有重要意义。

目前所遇到的问题是,在网络安全分析领域中对安全监控实时性要求较高,然而构建采用包装方法的安全分析模型很大程度上需要依赖训练数据,同时增加了模型训练的复杂度,导致此类模型不适合进行安全分析数据的预处理工作。然而信息熵理论在网络安全分析领域有着广泛的应用,由于信息熵理论能够很好的度量变量的不确定程度,因此不少工作通过信息熵理论来完成安全数据的特征选择过程。

信息熵理论是信息论当中的一个重要的概念,通常在网络安全分析领域以及诸多相关领域中被用来衡量事物的不可预测性。信息熵在网络安全分析领域的主要应用有入侵检测、认证与访问控制、隐私保护和信任计算、信息隐藏和数字取证以及云计算和移动社交网络中的安全问题等诸多方面。模糊集理论也是一种行之有效的特征选择工具,通过排序机制重排特征序列,并可以利用条件信息熵度量特征的不确定性。由于上述几个应用中,信息熵理论可以很好的评估数据特征在整个模型中的贡献,且应用于分类问题时,准确率和运算速度明显增多,因此成为网络安全分析领域热门研究方向。

综上所述,针对于网络安全分析领域中特征数量庞大,计算复杂高的问题,本发明提出一种基于模糊集特征熵值计算的特征选择方法,可以优化特征选择,降低计算复杂度。

发明内容

本发明的目的在于解决网络安全分析领域中特征数量庞大,计算复杂高的问题,为解决网络安全分析数据当中的特征重要性评估问题,虽然经典的熵值理论可以直接评估单独特征对分类结果的贡献度,但传统的熵值计算方法跟特征的取值数量有关,并且只能处理离散型特征。模糊集是一种对大数据环境进行安全分析时高效的一种方法,因此本发明提出了一种基于模糊集特征熵值计算的特征选择方法,为安全分析数据计算特征熵值。其中提出的基于信息熵理论的安全数据特征重要性评估方法,即Feature ImportanceEvaluating Method Based on Information Entropy,FIEE使用特征的缩放因子和特定类别之间的熵值来计算每个类别中理想矢量之间的距离,可以优化特征选择,降低计算复杂度。

本发明的目的是这样实现的:

一种基于模糊集特征熵值计算的特征选择方法,包括以下步骤:

步骤1,计算理想矢量矩阵:对训练数据集X上所有样本计算广义均值求其计算理想矢量矩阵V;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910914920.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top