[发明专利]基于静电力的密度峰聚类算法在审
申请号: | 202210319079.9 | 申请日: | 2022-03-29 |
公开(公告)号: | CN114781491A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 李想;万静;张茗洋 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 静电力 密度 峰聚类 算法 | ||
本发明针对密度峰值聚类算法(DPC)仅通过在阈值范围内样本数量来进行定义局部密度、对于阈值边缘部分的聚类不准确这两个缺陷。提出了一种基于静电力的密度峰聚类算法。首先,结合静电力公式提出了一种新的局部密度计算公式,不再简单的用在阈值内的数据点个数来表示局部密度,会更加准确;其次根据共享近邻的概念将边缘点进行重新检验并划分,避免了因为距离原因而导致的划分错误。
技术领域
本发明属于聚类分析技术领域,只要是为密度峰聚类算法进行改进优化。具体是一种基于加权共享最近邻的自适应聚类中心密度峰值聚类算法,可应用于图像处理、医学诊断、数据挖掘等领域。
背景技术
自从2012年以来,“大数据”这一次被多次提及,因为随着互联网的发展,使数据和人类的生活越来越密不可分。各行各业的数据资源都开始了量化的过程,大数据作为这个高科技时代的产物,极大地方便了人类的工作和生活。数据挖掘领域作为大数据的一个重要分支,是指在海量的数据中,通过算法搜索出其中有用的信息的过程。聚类分析,在数据挖掘领域起着不可替代的作用。聚类旨在没有标签的数据中,通过算法找出数据间的相似性并进行归类,是无监督学习的一种。
在进入大数据时代,聚类发展的尤为迅猛,这一领域的研究人员提出了大量的聚类算法。例如 DBSCAN算法、AP算法、k-means算法等。Rodriguez等人于2014年在Science上提出了一种新的基于密度的聚类算法——快速搜索和寻找密度峰值聚类算法(clusteringby fast search and find of density peaks, DPC)这就是著名的DPC算法。DPC算法相比较于其他算法,首先,它具有较高的分类效率且原理简单;其次,解决了k-means的只能处理凸形簇的缺点;最后,DPC算法仅需要较少的参数且不需要迭代,这样就极大的减少了时间消耗。但是该算法比较依赖于截断距离(参数)的选择,要根据认为经验来确定参数的大小,且参数选择不合适会对聚类结果产生较大的影响。DPC也对流型的数据集的聚类效果不是很有效。
基于层次的聚类算法。AGNES算法一种从底向上聚合聚类的一种算法,先将数据集中每一个样本都看成一个初试聚类,然后在运行中每一部找出两个距离最近的聚类簇进行合并,一直进行迭代,直到到达预设的聚类个数。AGNES算法实现较为简单,但是已经合并的簇不能被取消,所以再进行添加样本,会对结果的影响比较大。基于划分的聚类算法,例如最经典的聚类算法k-means算法,是一种基于欧氏距离的聚类算法,计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心,并且每一次要更新聚类中心,直到收敛。这种算法的优点是实现容易、原理简单。但是这类的算法只能处理凸形簇。同样是基于密度的聚类算法DBSCAN,这种算法提出了密度可达、密度直达等一系列的概念,可以对任意形状的数据进行分类。
自DPC算法提出至今,有很多的学者在DPC算法的基础上进行创新,也提出了很多解决DPC算法缺陷的算法。例如,LI等提出的一种针对传统密度峰值聚类算法无法适应数据库中数据量动态增长的知识发现问题,提出一种改进的进化密度峰值聚类算法(EDPC)。TONG提出的一种新的基于密度的聚类算法,新的不依赖截止距离的非中心节点分配策略和一种识别噪声节点的方法的NN-DPC算法。QIU提出了一种基于人工蜂群优化的密度峰值算法,改进后的DPC算法可以更好地实现簇间数据点的自动识别和合理聚类,降低原始密度峰值聚类(DPC)取值难度。
密度峰值聚类的核心思想包括:聚类中心的密度要比周围邻居的密度大且聚类中心之间的距离较远。通过定义局部密度和相对距离来画出聚类中心的决策图,选取局部密度大且相对距离大的点作为聚类中心。因此在数据集中的每个点都要计算该点的局部密度值和相对距离。下面对局部密度ρi和相对距离δi进行定义。
假设数据集A={xi|i=1,2,3……,n},n代表数据集的A的大小。
局部密度也就是该数据点的密度值,下面给出截断核的定义:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210319079.9/2.html,转载请声明来源钻瓜专利网。