[发明专利]一种面向数据流的全在线聚类方法在审
申请号: | 201810333661.4 | 申请日: | 2018-04-13 |
公开(公告)号: | CN108537285A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 杜韬;曲守宁;许婧文;王玉栋;武奎;庞战;刘闯;张瑞;李国昌;牟国栋 | 申请(专利权)人: | 济南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 张渲 |
地址: | 250022 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 数据流 聚类算法 全在线 动态数据流 数据流对象 角色判断 衰减机制 在线聚类 在线数据 更新 邻域 | ||
1.一种面向数据流的全在线聚类方法,其特征在于,包括以下步骤:
S1:基于在线数据角色判断的动态数据流聚类算法进行聚类;
S2:根据多速率的数据衰减机制,更新数据流对象;
S3:基于邻域的密度更新聚类算法;
S4:在线聚类调整。
2.根据权利要求1所述的一种面向数据流的全在线聚类方法,其特征在于,所述步骤S1中,通过与簇内点的数值比较,自动发现簇头和离群点,公式如下:
γ=δ×ρ (1)
ω=δ×ρ (2)
其中ρ是每个数据点的局部密度值,δ是到当前点最近且密度高的点的距离,簇头的ρ和δ都较大,而离群点的ρ较小,δ较大。
3.根据权利要求2所述的一种面向数据流的全在线聚类方法,其特征在于,
步骤S2中,数据衰减函数如公式如下:
λ1=Nc/N是簇头衰减因子,其中Nc是当前簇头的数量,N是当前有效的全体数据数量;λ2=Nb/N是簇内点的衰减因子,其中Nb是当前簇内点的数量;λ3=N/(N+No)是离群点的衰减因子,其中No是离群点数量。
4.根据权利要求3所述的一种面向数据流的全在线聚类方法,其特征在于,
步骤S3中,对每个更新数据点i,只对其邻域范围内的数据点的密度变化值进行计算,具体方法如公式4所示。
其中,ρ′j是i的邻居节点j的现有密度值,dij是数据i与j之间的距离,dc是邻域半径,如果i是新增数据,则公式(4)中间运算符取加法,如果i是被删除数据,则中间运算符取减法。
5.根据权利要求4所述的一种面向数据流的全在线聚类方法,其特征在于,
步骤S4中,根据密度属性变化情况实时跟踪数据角色变化情况,以簇头的变化触发调整类操作,当现有数据中出现簇头点变化的情况,算法对当前所有数据进行重新计算密度属性、重新判别角色、重新聚类,实现对类的动态调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810333661.4/1.html,转载请声明来源钻瓜专利网。