[发明专利]一种优化聚类中心的k-means算法在审
| 申请号: | 202110669183.6 | 申请日: | 2021-06-16 | 
| 公开(公告)号: | CN113361616A | 公开(公告)日: | 2021-09-07 | 
| 发明(设计)人: | 沈学利;陈治琦 | 申请(专利权)人: | 辽宁工程技术大学 | 
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 | 
| 代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营 | 
| 地址: | 123000 辽*** | 国省代码: | 辽宁;21 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 优化 中心 means 算法 | ||
1.一种优化聚类中心的k-means算法,其特征在于,包括以下步骤:
步骤1、求出样本数据集X={X1,X2,...,Xn}的样本均值C和平均距离ad;
步骤2、根据空间两点间的距离公式计算出所有数据对象与C的距离d(X,C),选择满足d(Xi,C)≥d(Xj,C),(i,j=1,2,...,n)的数据对象Xi,找到该方向位置点并记作O1;
步骤3、通过两点间距离公式找到与方向位置点X1的距离小于等于平均距离ad的数据点,并将其放入到集合Z1中,寻找结束后并统计集合Z1中的所包含的数据点个数记作n1,然后判断n1是否大于等于β,其中β为样本集数据点的数目与聚类的簇类数目的比值;若满足条件,则取该集合内的所有样本数据点的均值作为初始聚类中心点;
步骤4、计算所有样本集数据对象与方向位置点O1的距离d(X,O1),选择能够满足d(Xi,C)+d(Xi,O1)≥d(Xj,C)+d(Xj,O1)的数据对象Xi,将第二个方向位置点记作O2,同理,计算与方向位置点O2的距离小于等于平均距离ad的数据点,并放入集合Z2中,并统计集合中的数据点数n2,然后判断n2是否大于等于β,若满足条件,则取该集合的数据点的均值为该第二个初始聚类中心点;
步骤5、重复上述过程,直到找到K个初始聚类中心为止,其中当出现某个集合中的样本数据点的数量不满足大于等于β的情况,则继续寻找下一个方向位置点进行判断,方向位置点O的寻找及确定需要满足如下条件:计算所有样本数据对象与方向位置点O距离d(Xi,O),其中O=(O1,O2,...,Om),然后寻找满足(i,j=1,2,...,n)的数据点O作为第m个方向位置点。
2.如权利要求1所述的优化聚类中心的k-means算法,其特征在于,所述步骤1中,样本数据集的平均距离为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110669183.6/1.html,转载请声明来源钻瓜专利网。





