[发明专利]基于最小距离最大化准则优化初始中心的模糊聚类方法在审
| 申请号: | 201810889964.4 | 申请日: | 2018-08-07 |
| 公开(公告)号: | CN109272015A | 公开(公告)日: | 2019-01-25 |
| 发明(设计)人: | 陈鑫;左光;齐玢;石泳;侯砚泽;张敏捷;陈冲 | 申请(专利权)人: | 北京空间技术研制试验中心 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京谨诚君睿知识产权代理事务所(特殊普通合伙) 11538 | 代理人: | 陆鑫;延慧 |
| 地址: | 100094 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 聚类 最大化准则 模糊聚类 最小距离 样本点 优化 空间分布特性 欧式距离 初始点 鲁棒性 求解 稠密 集合 重复 | ||
本发明涉及一种基于最小距离最大化准则优化初始中心的模糊聚类方法,包括以下步骤:a.求解样本点中任意两点之间的欧式距离;b.计算每个点到其他点的距离的平均值;c.确定第一个聚类初始中心;d.确定稠密样本点集合;e.确定下一个聚类初始点;f.重复步骤e,直至选取所有所需的初始聚类点个数。根据本发明的基于最小距离最大化准则优化初始中心的模糊聚类方法相比于标准FCM方法能够考虑对象的空间分布特性,且具有更好的聚类效果和鲁棒性,具有更高的效率。
技术领域
本发明涉及一种基于最小距离最大化准则优化初始中心的模糊聚类方法。
背景技术
聚类分析的基本思想是根据各个待分类样本点之间的相似程度,将相似特性样本点归为一类的方法。近年来,模糊聚类技术作为一种重要的数据处理技术手段,受到越来越多的关注和重视。模糊c均值(fuzzy C-means,FCM)方法是目标函数聚类方法中点的典型代表,它利用模糊理论建立对象类属的不确定性描述,通过优化目标函数得到每个对象对类中心的隶属度,从而起决定样本点的类属。标准FCM方法实现容易、聚类效果较好,特别是在大数据处理、人工智能应用、顾客期望服务调度系统、新闻热点分析、图像分割等领域得到广泛应用。但是标准FCM方法存在以下问题:1)初始聚类中心是随机选取,因此对聚类结果影响较大,存在着鲁棒性差的问题;2)忽略了各个样本点空间位置分布的不同对聚类结果的影响。
模糊c-均值聚类方法(Fuzzy c-means Clustering Method,FCM)是由Bezkek于1981年提出的,它是目前广泛采用的一种模糊聚类算法。在缩减设计空间时,模糊c-均值聚类法用于对数据点的隶属度进行分类,完成数据的模糊聚类划分。
FCM方法如下:考虑一个样本集合X=[xij],i=1,2,L,m;j=1,2,L,n,其中m代表所含的样本点个数,n代表样本点的维数。将此集合依据一定的准则用模糊聚类的方法分成个模糊子集,这里c是给定的聚类个数,所用的准则一般是优化一个用来表征聚类的性能指标的目标函数。模糊c(2≤c≤m)聚类的分类结果可用隶属矩阵U表示:
U=[uij],i=1,2,L,c;j=1,2,L,m (1)
式中uij的值在[0,1]之间,表示样本集合中的元素xj属于第i个聚类的程度,同时uij还必须满足:
FCM算法的目标函数一般为如下形式:
式中,
式中d为影响隶属度矩阵模糊化程度的指数权重(一般取d=2)。
求解式(3)中的极小值问题。即
给定一组样本点,采用模糊c-均值聚类法,得到最优解,即为分组后的聚类中心坐标和样本点隶属于各聚类中心的隶属度矩阵U*。
由以上FCM方法过程中可知FCM对初始中心并未定义,实际应用中通常随机给定一组初始中心vi,不断通过优化迭代求解(3)式的极小值问题,即式(5)所示。这样不可避免存在聚类效率低、陷入局部优化解、由于初始点随机选取会造成的鲁棒性较差的问题。
发明内容
本发明的目的在于解决上述问题,提供一种基于最小距离最大化准则优化初始中心的模糊聚类方法。
为实现上述发明目的,本发明提供一种基于最小距离最大化准则优化初始中心的模糊聚类方法,包括以下步骤:
a.求解样本点中任意两点之间的欧式距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京空间技术研制试验中心,未经北京空间技术研制试验中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810889964.4/2.html,转载请声明来源钻瓜专利网。





