[发明专利]一种隔离分布核构建方法、异常数据检测方法及装置有效

专利信息
申请号: 202010565100.4 申请日: 2020-06-19
公开(公告)号: CN111666316B 公开(公告)日: 2023-09-15
发明(设计)人: 陈开明;徐碧村;鷲尾隆;周志华 申请(专利权)人: 南京大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06F18/22
代理公司: 江苏瑞途律师事务所 32346 代理人: 金龙
地址: 210023 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 隔离 分布 构建 方法 异常 数据 检测 装置
【权利要求书】:

1.一种隔离分布核构建方法,包括如下步骤:

使用隔离空间划分机制从给定数据集D中产生t个空间划分W∈Vψ(D);

根据空间划分Vψ(D)产生隔离内核的特征映射Φ(·|D);

定义隔离内核;

根据隔离内核,定义隔离分布核及隔离分布核的特征映射;

使用隔离空间划分机制从给定数据集D中产生t个空间划分Wi∈Vψ(D),每一个划分Wi都有固定数量ψ个隔离分区θj:Vψ(D)用于产生隔离内核的特征映射Φ(·|D);

根据空间划分产生隔离内核的特征映射Φ(·|D);

定义隔离内核:

其中,κI点内核衡量数据集中两个数据点x,y的相似度;

给定S是分布PS中的一个样例数据,隔离分布核的特征映射

定义隔离分布核:

T是分布PT中的一个样例数据。

2.一种异常数据检测方法,包括如下步骤:

映射输入空间中数据点x∈D到希尔伯特空间;

采用权利要求1所述的方法生成隔离分布核;

衡量该数据点与整个数据集相似度;

根据相似度排序找出异常点。

3.根据权利要求2所述的一种异常数据检测方法,其特征在于:

所述的相似性检测即计算

如果x~PD,那么大或趋于1,越接近于1,x是PD的一部分概率越大;

如果那么小或趋于0,越接近于0,x是PD的一部分概率越小;

其中δ(x)是x的狄拉克度量函数;

用于排列D数据集中的不同点,取前m个点,视作异常。

4.一种异常数据检测方法,包括如下步骤:

对输入空间中数据群中每个群T~PT映射到一级希尔伯特空间中的点一级希尔伯特空间的整个数据集表示为DH

映射一级希尔伯特空间的点z到二级希尔伯特空间的点

映射一级希尔伯特空间的数据集DH~PDH到二级希尔伯特空间的点

衡量二级希尔伯特空间的与的相似度

根据相似度排序找出希尔伯特空间的异常点,为对应输入空间中异常群;

在第一和第二级的希尔伯特空间分别使用两层的隔离分布核映射与

一级隔离分布核将输入空间中的每个群T~PT映射到希尔伯特空间中的一个点一级希尔伯特空间的整个数据集表示为DH

二级映射方式为,一级希尔伯特空间中数据点z∈DH到二级希尔伯特空间点的转换,其中,是二级隔离分布核的特征映射,它也将一级希尔伯特空间中的数据集DH映射到希尔伯特空间中的点

二级隔离分布核使用度量一级希尔伯特空间中δ(z)相比数据集的分布的相似性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010565100.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top