[发明专利]基于静电力的密度峰聚类算法在审
| 申请号: | 202210319079.9 | 申请日: | 2022-03-29 |
| 公开(公告)号: | CN114781491A | 公开(公告)日: | 2022-07-22 |
| 发明(设计)人: | 李想;万静;张茗洋 | 申请(专利权)人: | 哈尔滨理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 静电力 密度 峰聚类 算法 | ||
1.基于静电力的密度峰值聚类算法,其特征在于,包括以下步骤:
步骤1.局部密度计算阶段:根据静电力公式提出了一种计算数据之间相似度的公式,并用其重新定义了局部密度的计算方法;
步骤2.聚类中心选取阶段:在计算完数据集中的局部密度ρi和相对距离σi后,以局部密度ρi为横坐标,相对距离σi为纵坐标,画出决策图,选取局部密度ρi大,相对距离σi也大的数据点作为聚类中心点;
步骤3.簇边缘数据点重新检查并重新分配阶段:提出了一种新型的判断数据点与某一簇的归属概率的公式,根据已经分配完的各个簇,检查每个簇边缘的数据点,用该公式重新计算边缘点和每个簇的相似程度,选取相似程度最大的簇作为它的最终簇。
2.根据权利要求1所述的基基于静电力的密度峰值聚类算法,其特征在于,所述骤1中,根据静电力提出了一种新型局部密度计算公式:
用这种方式计算出来的局部密度考虑到了数据点之间的相似程度,而不是简单的用截断范围内的数据点的个数,会使聚类中心的选取更加准确。
3.根据权利要求1所述的基基于静电力的密度峰值聚类算法,其特征在于,所述骤2中,根据新型计算公式计算出的局部密度ρi和相对距离σi分别作为横轴和纵轴,聚类中心点和普通点完全分开,选取局部密度大且相对距离也大的点作为聚类中心,局部密度小但是相对距离大的为离群点,并将所有点分配到距离最近的聚类中心所在的类簇中。
4.根据权利要求1所述的基于静电力的密度峰值聚类算法,其特征在于,提出了一种新型判断数据点与某一簇的归属概率的公式,任意簇对任意数据点的相似度,定义如下:
其中,点o为聚类中心点只能提供“引力”作用,继续计算出其他点(不包括数据点本身和聚类中心点)对该点的平均“斥力”,然后根据公式进行做差再取绝对值,得出的结果就为该簇对该数据点的相似度;相似度越高则说明该数据点属于该簇的几率越大,相似度越小则说明该数据节点属于该簇的几率越小;
根据上述相似度公式计算出,边缘数据点对每一个簇的相似度,若自己现在所在簇的相似度即为最高那么就不需要更改,若其他簇的相似度比自己目前所在簇的相似度要高则将其划分到相似度较大的那一簇中;
根据此方法将边缘数据点进行检验,解决了一些算法的划分错误问题,使算法更加准确。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210319079.9/1.html,转载请声明来源钻瓜专利网。





