[发明专利]一种K近邻相似度优化的密度峰聚类方法在审
| 申请号: | 201710607140.9 | 申请日: | 2017-07-24 |
| 公开(公告)号: | CN107392249A | 公开(公告)日: | 2017-11-24 |
| 发明(设计)人: | 葛洪伟;朱庆峰;江明;李莉 | 申请(专利权)人: | 江南大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 近邻 相似 优化 密度 峰聚类 方法 | ||
1.K近邻相似度优化的密度峰聚类方法,包括:
(1)计算所有点间距离,算出截断距离dc值,利用高斯函数:计算每个数据点的密度,然后利用函数:计算每个点到密度比它大的最近点的距离δ。其中,dij表示点i和点j的距离。对于全局密度最大的点,令δi=maxjdij。
(2)根据每个点的ρ和δ值画出决策图,找出聚类中心。
(3)根据函数:计算点间相似度,找到每个点的K近邻点。其中X=(x1,…,xd)和Y=(y1,…,yd)是d维空间中的两个向量,mi表示第i维上X和Y的平均值的绝对值。
(4)所有的点按照密度从大到小排序,新建空数组Aq,Bq,并把聚类中心依次放入数组Aq。
(5)按照密度从大到小的顺序,依次取点i,判断点i是否已经分配。如果已经分配,取下一个;如果未分配,则进行下一步。
(6)判断点i是否是密度峰值点。如果不是,取下一个;如果是,判断点i与指向点j是否连通。如果连通,把点i放入数组Aq末尾;如果不连通,则把点i放入数组Bq末尾。
(7)判断数组Bq是否为空,如果为空,则将剩余的点分配,结束;如果不为空,则分别从数组Aq中找出一个点j,从数组Bq中找出一个点h,满足点j与点h距离最近。
(8)判断点h与点j是否连通,如果连通,则点h的指向点为点j,把点h归入点j所在族类,并将点h加入数组Aq末尾,并从数组Bq中删除点h;如果不连通,寻找下一对最近点,判断。重复,直到数组Bq为空或者数组Bq中剩余点都不与数组Aq中的点连通。
(9)判断数组Bq是否为空,如果为空,则将剩余的点分配给指向点,结束;如果不为空,则从数组Bq中找出点t,从数组Aq中找出点j,满足点t与点j距离最近,将点t指向点j,并将点t加入数组Aq末尾,从数组Bq中删除点t,重复,直到数组Bq为空。
(10)将剩余的点分配给指向点,结束。
2.根据权利要求书1所述的K近邻相似度优化的密度峰聚类,其中,步骤(6)所述的判断点i是否为密度峰值点以及点i和点j是否连通,按照如下方法:
(2.1)根据决策图,选出聚类中心,剩余的点如果不在其指向点的K近邻内,那么它就是密度峰值点。根据DPC算法定义,聚类中心到密度比它大的最近点距离较远,所以聚类中心也作为密度峰值点。
(2.2)如果一个点i(样本点)在点j(指向点)的K近邻内,则点i与点j连通。否则,从点j的K近邻内寻找与点i相似度最大的点jn(第n次找到的点),判断点i与点jn相似度是否大于点i与点jn-1(第n-1找到的点,j0=j):如果点i与点jn的相似度大于点i与点jn-1,并且i点在点jn的K近邻内,则点i与点j连通;如果点i与点jn的相似度大于点i与点jn-1,但是i点不在点jn的K近邻内,则从点jn的K近邻内继续寻找与点i相似度最大的点jn+1,重复上面的判断;如果点i与点jn的相似度小于等于点i与点jn-1,则点i与点j不连通。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710607140.9/1.html,转载请声明来源钻瓜专利网。





