[发明专利]基于动态包围盒最大间隙切分的竞争合作聚类方法有效
申请号: | 201410419179.4 | 申请日: | 2014-08-22 |
公开(公告)号: | CN104143009B | 公开(公告)日: | 2017-03-08 |
发明(设计)人: | 陈仁喜;周绍光 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京纵横知识产权代理有限公司32224 | 代理人: | 董建林 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于动态包围盒最大间隙切分的竞争合作聚类方法,提出了采用动态包围盒最大间隙切分的获得初始种子点的方法,即先在多维特征空间中计算数据的包围盒,并将该包围盒内的数据点向最长轴进行投影,找出相邻投影点最大间距位置对该包围盒进行一分为二,如此递归,直到将整个空间切分成足够多的子空间,最后计算出子空间的中心作为初始种子点;本发明还针对同一个聚类被碎化成多个类的现象,提出采用距离半径分析法对聚类进行合并操作,能够自适应的将碎分的各个类组建成一个完整的聚类。本发明可以避免随机化种子点造成的遗漏现象,可以避免聚类碎化现象,有利于快速的获得真实的聚类结果。 | ||
搜索关键词: | 基于 动态 包围 最大 间隙 切分 竞争 合作 方法 | ||
【主权项】:
基于动态包围盒最大间隙切分的竞争合作聚类方法,其特征在于,包括以下步骤:1)设定初始聚类类别数K;2)对N个输入数据进行分析,采用动态包围盒最大间隙切分算法初始化K个种子点,具体步骤如下:2‑1)将输入数据作为多维空间的点,计算能包含所有输入数据的最小外包矩形;2‑2)比较最小外包矩形各个维度上的长度,选择长度最大对应的维度为切分轴;2‑3)将所有输入数据点投影到该切分轴,然后将投影点按照由小到大的顺序进行排列;2‑4)计算前后两个相邻投影点之间的距离,选择距离最大的两个相邻投影点作为切分位置,将输入数据沿着该切分轴分成两个子集;2‑5)选择所有子集中包围盒体积最大的那个子集再次执行步骤2‑1)—2‑4),对该子集进行一分为二;2‑6)重复步骤2‑5),直到获得K个子集为止;2‑7)计算所获得的K个子集的几何中心,作为初始种子点;3)令每个初始种子点的获胜次数nk=1,k=1,...,K;4)对于当前输入数据xi,计算指标函数I(j|xi):其中,cp表示第p个种子点,rp表示第p个种子点的相对获胜率,rp=np/Σj=1Knj]]>np为第p个种子点的获胜次数,找出满足指标函数I(j|xi)=1的种子点,记为获胜种子点cw;5)查找以获胜种子点cw为中心,以||cw‑xi||为半径的圆内的所有种子点,形成合作群体;6)对合作群体内的所有种子点按如下公式进行更新:cunew=cuold+η(xi-cuold)]]>其中,表示更新前的种子点,表示更新后的种子点,η为学习率参数;7)按下式更新获胜种子点cw的获胜次数,nwnew=nwold+1]]>其中,为更新前获胜种子点cw的获胜次数,为更新后获胜种子点cw的获胜次数;8)重复步骤4)—步骤7),直到种子点不再变化;9)剔除重复种子点;10)进行聚类合并操作,形成最终聚类结果:假设完成迭代和重复种子点删除之后,最终得到M个种子点,称为聚类中心,记为dm,m=1…M,M≤K,然后将每个输入数据标记为所属的聚类中心,聚类合并的具体操作如下:10‑1)根据输入数据所属的聚类中心的标记信息Lab(xi),计算每个聚类中心所能覆盖的半径Rm,m=1…M;10‑2)取出两个聚类中心dq和dt,q∈[1,M],t∈[1,M],且满足q<t,计算它们之间的欧式距离Dqt,若满足下列条件:Dqt≤Rq或者Dqt≤Rt则将输入数据中标记信息Lab(xi)为t的输入数据都重新标记为q,即将t类合并到q类;10‑3)对所有的两个聚类中心进行所述步骤10‑2)的操作,直到没有可合并的聚类为止;10‑4)重新计算经合并后的各个类的聚类中心,获得最终H个(H≤M)聚类中心。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410419179.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种空间绳网机器人的逼近动力学建模方法
- 下一篇:一种匹配检测方法及装置