[发明专利]一种无参的复杂流形聚类方法在审
申请号: | 201910816688.3 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110516753A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 黄金龙;程东东;张素兰;邢昌元 | 申请(专利权)人: | 长江师范学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 50212 重庆博凯知识产权代理有限公司 | 代理人: | 胡逸然<国际申请>=<国际公布>=<进入 |
地址: | 408100 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类结果 目标数据 间隔性 紧密性 流形 最短路径距离 聚类集合 聚类 聚类算法 评价标准 有效评价 预设条件 综合考虑 数据集 噪声点 预设 | ||
1.一种无参的复杂流形聚类方法,其特征在于,包括:
S1、获取目标数据集D;
S2、使用预设聚类算法A求得所述目标数据集D的待确定聚类集合C,C={C1,C2,…,CM};
S3、确定所述目标数据集D中所有的自然核心点;
S4、从所述目标数据集D中提取初始聚类结果c,c={c1,c2,…,cm};
S5、计算每两个自然核心点之间的簇距离;
S6、计算每两个自然核心点之间的最短路径距离;
S7、基于待确定聚类集合C,以及每个自然核心点与其他自然核心点之间的最短路径及最短路径距离,计算每个待确定类的紧密性及间隔性;
S8、基于每个待确定类的紧密性及间隔性计算评价值,若评价值满足预设条件,则将所述待确定聚类集合C作为最终的聚类结果。
2.如权利要求1所述的无参的复杂流形聚类方法,其特征在于,步骤S3中:
计算目标数据集D中每个目标数据对象的密度Den(p),Dis(p,q)为目标数据对象p与目标数据对象q之间的欧氏距离,目标数据对象q为目标数据对象p的第K个自然邻居,若第一目标数据对象在第二目标数据对象的K-邻域内,且第二目标数据对象在第一目标数据对象的K-邻域内,则第一目标数据对象与第二目标数据对象相互为自然邻居,第一目标数据对象与第二目标数据对象为任意两个不相同的目标数据对象;
若目标数据对象p的密度在其K-邻域内最大,或者目标数据对象p的密度在其逆K-邻域内最大,则目标数据对象p为目标数据集D中的一个自然核心点。
3.如权利要求2所述的无参的复杂流形聚类方法,其特征在于,步骤S4中:
S401、将所有自然核心点设为未被访问状态;
S402、随机选择一个未被访问的自然核心点,将所述自然核心点及其稀邻居合并为一个初始簇C(i),i初始值为1,将所述自然核心点设为已被访问状态,若第一目标数据对象在第二目标数据对象的K-邻域内,且第一目标数据对象的密度小于第二目标数据对象的密度,则第一目标数据对象为第二目标数据对象的稀邻居;
S403、在所述初始簇C(i)中随机选择一个未被访问的数据对象,将所述数据对象的稀邻居合并到所述初始簇C(i)中,将所述数据对象设为已被访问状态;
S404、若所述初始簇C(i)中所有数据对象均为已被访问状态,则执行S405,否则返回执行S403;
S405、若所有自然核心点均为已被访问状态,将已经得到的初始簇作为准聚类中心组成初始聚类结果,否则将i的值加1并返回执行S402。
4.如权利要求3所述的无参的复杂流形聚类方法,其特征在于,步骤S5中:
任意两个不相同的初始簇C(i)与C(j)的簇距离为Dis(Ci,Cj);
式中,|Ci|表示初始簇C(i)中目标数据对象的数目,|Cj|表示初始簇C(j)中目标数据对象的数目,当初始簇C(i)和C(j)之间无交集时,将计算出的有交集的初始簇间的簇距离中的最大值加1作为无交集的初始簇之间的距离。
5.如权利要求4所述的无参的复杂流形聚类方法,其特征在于,步骤S6中:
任意两自然核心点pk及pk+1之间的距离为pk及pk+1对应的两初始簇之间的簇距离;
任意一最短路径P={p1,p2,…,pk,…,pn}中自然核心点p1到pn的最短路径距离为D(p1,pn),D(p1,pn)=max{Dis(pk,pk+1)}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长江师范学院,未经长江师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910816688.3/1.html,转载请声明来源钻瓜专利网。