[发明专利]一种环境异常检测方法和系统在审
| 申请号: | 202110552067.6 | 申请日: | 2021-05-20 |
| 公开(公告)号: | CN113515450A | 公开(公告)日: | 2021-10-19 |
| 发明(设计)人: | 岑纪鹏 | 申请(专利权)人: | 广东工业大学 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘晓娟 |
| 地址: | 510060 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 环境 异常 检测 方法 系统 | ||
1.一种环境异常检测方法,其特征在于,包括:
构建具有局部敏感特性的Isolation Forest模型;
将环境检测数据输入Isolation Forest模型进行数据过滤,得到候选异常数据集;
基于LOF算法对候选异常数据集进行异常数据判定,输出异常环境检测数据。
2.根据权利要求1所述的环境异常检测方法,其特征在于,构建具有局部敏感特性的Isolation Forest模型,包括以下步骤:
S11、获取环境数据训练集;
S12、采用LSH算法将环境数据训练集的环境数据训练样本划分到多个哈希桶内;
S13、Isolation Forest模型中的每颗ITree按概率随机从不同的哈希桶中抽取ψ个用于每颗ITree构建的环境数据训练样本;
S14、随机抽取环境数据训练样本中某个属性和属性的切分值,根据属性和切分值对每颗ITree的环境数据训练样本进行切分,得到左子树数据集和右子树数据集;
S15、在左子树数据集和右子树数据集上按照步骤S14重复构造子树,直到需划分的数据集中仅包含相同的环境样本或ITree的高度达到极限;
S16、重复步骤S13~S15,得到具有若干棵ITree的具有局部敏感特性的IsolationForest模型。
3.根据权利要求2所述的环境异常检测方法,其特征在于,将环境数据训练集划分到多个哈希桶内,包括:
将环境数据训练集中的单条环境数据训练样本视作环境样本向量v(t1,t2,...,tn),ti(1≤i≤n)为单条环境数据样本中的属性值;
使用hash函数族将环境数据训练集中的环境样本向量v映射到不同的哈希桶内,其中,a是与v同维数的空间随机向量,b为随机数,b∈[0,r],r为哈希函数的宽度,经过哈希映射后,环境数据训练集中任意两个环境样本向量v1,v2满足以下两个条件:
若d(v1,v2)<d1,则Pr[h(v1)=h(v2)]≥p1;
若d(v1,v2)>d2,则Pr[h(v1)=h(v2)]≤p2;
其中,d(v1,v2)为v1和v2之间的距离,d1<d2,h(v1)为环境样本向量v1的哈希变换,h(v2)为环境样本向量v2的哈希变换,Pr[h(v1)=h(v2)]为环境样本向量v1的哈希变换和环境样本向量v2的哈希变换映射为同一个哈希桶中的概率,p1、p2为概率阈值,p1>p2。
4.根据权利要求3所述的环境异常检测方法,其特征在于,将环境检测数据输入Isolation Forest模型进行数据过滤,得到候选异常数据集,包括:
将单条环境检测数据输入Isolation Forest模型,从ITree的根节点开始按照切分值往下走,直到达到叶子节点,记录过程中经过的路径长度;
获取环境检测数据在所有ITree中的路径长度,求取平均路径长度;
判断是否将环境检测数据放入候选异常数据集,其中,若平均路径长度小于阈值T,则将环境检测数据放入候选异常数据集。
5.根据权利要求4所述的环境异常检测方法,其特征在于,阈值T取值为T=ωlog2(ψ),ω为常数变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110552067.6/1.html,转载请声明来源钻瓜专利网。





