[发明专利]一种隔离分布核构建方法、异常数据检测方法及装置有效
| 申请号: | 202010565100.4 | 申请日: | 2020-06-19 |
| 公开(公告)号: | CN111666316B | 公开(公告)日: | 2023-09-15 |
| 发明(设计)人: | 陈开明;徐碧村;鷲尾隆;周志华 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F18/22 |
| 代理公司: | 江苏瑞途律师事务所 32346 | 代理人: | 金龙 |
| 地址: | 210023 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 隔离 分布 构建 方法 异常 数据 检测 装置 | ||
1.一种隔离分布核构建方法,包括如下步骤:
使用隔离空间划分机制从给定数据集D中产生t个空间划分W∈Vψ(D);
根据空间划分Vψ(D)产生隔离内核的特征映射Φ(·|D);
定义隔离内核;
根据隔离内核,定义隔离分布核及隔离分布核的特征映射;
使用隔离空间划分机制从给定数据集D中产生t个空间划分Wi∈Vψ(D),每一个划分Wi都有固定数量ψ个隔离分区θj:Vψ(D)用于产生隔离内核的特征映射Φ(·|D);
根据空间划分产生隔离内核的特征映射Φ(·|D);
定义隔离内核:
其中,κI点内核衡量数据集中两个数据点x,y的相似度;
给定S是分布PS中的一个样例数据,隔离分布核的特征映射
定义隔离分布核:
T是分布PT中的一个样例数据。
2.一种异常数据检测方法,包括如下步骤:
映射输入空间中数据点x∈D到希尔伯特空间;
采用权利要求1所述的方法生成隔离分布核;
衡量该数据点与整个数据集相似度;
根据相似度排序找出异常点。
3.根据权利要求2所述的一种异常数据检测方法,其特征在于:
所述的相似性检测即计算
如果x~PD,那么大或趋于1,越接近于1,x是PD的一部分概率越大;
如果那么小或趋于0,越接近于0,x是PD的一部分概率越小;
其中δ(x)是x的狄拉克度量函数;
用于排列D数据集中的不同点,取前m个点,视作异常。
4.一种异常数据检测方法,包括如下步骤:
对输入空间中数据群中每个群T~PT映射到一级希尔伯特空间中的点一级希尔伯特空间的整个数据集表示为DH;
映射一级希尔伯特空间的点z到二级希尔伯特空间的点
映射一级希尔伯特空间的数据集DH~PDH到二级希尔伯特空间的点
衡量二级希尔伯特空间的与的相似度
根据相似度排序找出希尔伯特空间的异常点,为对应输入空间中异常群;
在第一和第二级的希尔伯特空间分别使用两层的隔离分布核映射与
一级隔离分布核将输入空间中的每个群T~PT映射到希尔伯特空间中的一个点一级希尔伯特空间的整个数据集表示为DH;
二级映射方式为,一级希尔伯特空间中数据点z∈DH到二级希尔伯特空间点的转换,其中,是二级隔离分布核的特征映射,它也将一级希尔伯特空间中的数据集DH映射到希尔伯特空间中的点
二级隔离分布核使用度量一级希尔伯特空间中δ(z)相比数据集的分布的相似性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010565100.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型腋下拐杖
- 下一篇:一种铝碳化硅电子封装盒体连接器孔的制备方法





