[发明专利]一种面向进化数据流的实时聚类方法在审

专利信息
申请号: 201810109615.6 申请日: 2018-02-05
公开(公告)号: CN108319699A 公开(公告)日: 2018-07-24
发明(设计)人: 隋金坪;刘振;黎湘 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 国防科技大学专利服务中心 43202 代理人: 王文惠
地址: 410073 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据流 集合 进化 聚类 有效类 在线聚类 处理点 复现 整合 检测 更新 应用 统一
【说明书】:

发明提供一种面向进化数据流的在线聚类方法。技术方案包括下述步骤:①建立有效类集合、消失类集合、离群点集合的步骤;②对当前时刻获得的待处理点归入某个集合的步骤;③更新离群点集合、有效类集合和消失类集合的步骤。本发明针对进化数据流中典型的三种进化形式(即类的出现、消失与复现)分别设计了检测函数,并进行了整合统一,提高数据流聚类方法的稳定性,扩展了数据流聚类方法的应用范围。

技术领域

本发明属于数据流聚类技术领域,具体是涉及一种面向进化数据流的动态聚类方法。

背景技术

数据流,是指实时流入的数据,区别于传统的批量式获取的数据,通常按数据分布是否发生变化分为静态数据流(数据分布不变化)以及进化数据流(数据分布变化),进化数据流也被称为动态数据流。目前,数据流已成为信息社会的主要数据形式之一,如金融交易数据、通信记录数据、传感观测数据等。数据流聚类技术是指通过某种聚类手段来实现数据流的分析,其凭借不依赖先验信息的强大优势目前成为数据流挖掘的主要手段之一。

目前,数据流聚类方法主要针对的是静态数据流。实际上,现实中的数据流普遍具有进化特性(或称动态特性),即数据流数据动态流入过程中会进行如新类出现、旧类消失、旧消失类复现(以下分别简称为出现、消失、复现)等进化形式。在实际应用中,检测这些普遍存在的进化形式通常对用户具有更重要的意义,如可用来实现在天文学、医药、金融、网络等领域的监测和观察目的等。因此,迫切需要针对进化数据发展数据流聚类技术。其意义在于,一方面这将提高用户关于数据流当前聚类模式以及各类的进化的全面的理解;另一方面,也帮助用户在所有数据到达之前便做出准确的判断,如寻找网络异常侵入时间、估计给定时间段的类数以及寻找最优调整时间。尽管国内外学者已就面向进化数据流的数据流聚类技术展开了许多尝试,但主要针对的新类出现这一进化形式展开,这严重限制了数据流聚类算法的应用范围,因此,有必要扩展数据流聚类技术处理多种进化形式数据的能力。

发明内容

本发明提供一种面向进化数据流的在线聚类方法,针对进化数据流的三种典型的进化形式,即出现、消失、复现,分别设计了检测策略,并设计了处理框架,同时将三种检测策略进行了整合,从而实现了本发明对进化数据流的实时聚类,能够使得数据流中的新类及时地加入、消失的类及时地被移除、以及复现的类被及时恢复而不需要重新再形成。

本发明的技术方案是:一种面向进化数据流的实时聚类方法,其特征在于,包括下述步骤:

①建立有效类集合、消失类集合、离群点集合的步骤;

②对当前时刻获得的待处理点归入某个集合的步骤;

③更新离群点集合、有效类集合和消失类集合的步骤。

其中:

①建立有效类集合、消失类集合、离群点集合的步骤;

其中有效类集合的初始值是收集一定量数据,再利用静态聚类方法对初始化集合进行聚类而得到的结果的集合;消失类集合的初始化值为空集;离群点集合的初始化值为空集。

②对当前时刻获得的待处理点归入某个集合的步骤,包括:

首先计算待处理点与有效类集合以及消失类集合中的类的欧式距离,并求最小值;

然后对上述最小值与预定离群点门限进行比较:若最小值大于上述门限,则将待处理点分入到离群点集合中;若最小值小于或等于上述门限,则将待处理点分入最小值对应集合的类中。

③更新离群点集合、有效类集合和消失类集合的步骤:

(a)更新离群点集合的步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810109615.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top