[发明专利]一种聚类中心的确定方法、确定系统及一种聚类方法在审
申请号: | 201710730191.0 | 申请日: | 2017-08-23 |
公开(公告)号: | CN107480724A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 王春枝;刘川;叶志伟;胡继雄;陈宏伟;刘伟;宗欣露;苏军;严灵毓;陈颖哲;任紫扉;王俊 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京高沃律师事务所11569 | 代理人: | 王戈 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中心 确定 方法 系统 | ||
技术领域
本发明涉及大数据挖掘领域,特别是涉及一种聚类方法及系统。
背景技术
大数据技术的发展,随之产生的数据量急剧增加,传统的数据处理方法已经无法满足要求,聚类分析作为一种大数据挖掘技术再次成为研究热点。聚类分析是一种重要的无监督学习方法,聚类分析的目的是寻找隐藏在数据中的结构,并按照某种相似性度量,尽可能地使具有相同性质的数据归于同一类。
然而,传统的K均值(K-means)聚类算法的初始聚类中心是随机选取的。对于多次迭代的聚类算法,本次迭代的聚类中心是通过更新上一次迭代的中心得到的,因此,作为聚类结果的计算基础,初始聚类中心的选取至关重要。如果初始聚类中心是随机产生的,很难收敛到正确的聚类结果。
因此,如何确定K均值算法的初始聚类中心,成为本领域技术人员亟需解决的技术问题。
发明内容
本发明的目的是提供一种聚类中心的确定方法,通过传播处理可以从优化搜索的角度出发进行进化,使聚类中心一代又一代地优化,并逼进最优聚类中心。
为实现上述目的,本发明提供了如下方案:
一种聚类中心的确定方法,所述确定方法包括:
构建包括多个水波的水波群,并随机初始化各所述水波的位置、波高和波长,其中,每个所述水波包括m个聚类中心;
对所述水波群中的各所述水波进行传播处理;
分别判断传播处理后的各水波的适应度值是否大于传播处理前的水波的适应度值,得到第一判断结果;
若所述第一判断结果表示传播处理后的水波的适应度值大于传播处理前的水波的适应度值,则用传播处理后的水波代替所述水波群中传播处理前的水波;
若所述第一判断结果表示传播处理后的水波的适应度值小于或等于传播处理前的水波的适应度值,则更新所述水波群中传播处理前的水波的波高和波长,且传播处理前的水波的位置保持不变;
根据各所述第一判断结果更新所述水波群,并更新所述水波群的迭代次数;
判断更新后的迭代次数是否小于设定的进化代数,得到第二判断结果;
若所述第二判断结果表示更新后的迭代次数小于设定的进化代数,则返回继续对更新后的所述水波群中的各所述水波进行传播处理;
若所述第二判断结果表示更新后的迭代次数等于设定的进化代数,则计算更新后的所述水波群中各水波的适应度值,筛选出更新后的所述水波群中适应度值最大的水波作为最优水波,所述最优水波的聚类中心为最优聚类中心。
可选的,所述判断所述传播处理后的各水波的适应度值是否大于所述传播处理前的水波的适应度值,得到第一判断结果,具体包括:
根据公式:分别计算各传播处理前的水波的适应度值及传播处理后的水波的适应度值,其中,p表示常数,Fc表示适应度函数,m表示聚类中心的个数,xi表示第i个聚类的聚类中心,1≤i≤m,cij为表示第i个聚类内的第j个数据对象,d(xi,cij)表示第i个聚类内的第j个数据对象与第i个聚类的聚类中心的距离;
判断各传播处理后的水波的适应度值是否大于传播处理前的水波的适应度值,得到第一判断结果。
可选的,所述对所述水波群中的各所述水波进行传播处理前还包括:
计算各所述水波的适应度值,筛选出适应度值最大的水波作为当前最优水波;
判断所述当前最优水波的适应度值是否大于或者等于设定的适应度阈值,获得第三判断结果;
当所述第三判断结果表示所述当前最优水波的适应度值大于或者等于设定的适应度阈值,则所述当前最优水波的聚类中心为最优聚类中心;
当所述第三判断结果表示所述当前最优水波的适应度值小于设定的适应度阈值,则对所述水波群中的各所述水波进行传播处理。
可选的,所述用传播处理后的水波代替所述水波群中传播处理前的水波,具体包括:
判断所述传播处理后的水波的适应度值是否大于所述当前最优水波的适应度值,获得第四判断结果;
若所述第四判断结果表示所述传播处理后的水波的适应度值小于或等于所述当前最优水波的适应度值,则用传播处理后的水波代替所述水波群中传播处理前的水波;
若所述第四判断结果表示所述传播处理后的水波的适应度值大于所述当前最优水波的适应度值,则对所述传播处理后的水波进行碎浪处理,获得多个子波;
计算各所述子波的适应度值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710730191.0/2.html,转载请声明来源钻瓜专利网。