[发明专利]一种特征加权的模糊紧致散布聚类方法有效
申请号: | 201410265975.7 | 申请日: | 2014-06-13 |
公开(公告)号: | CN104008197A | 公开(公告)日: | 2014-08-27 |
发明(设计)人: | 周媛;何军;夏景明 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 顾进;叶涓涓 |
地址: | 210044 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 加权 模糊 散布 方法 | ||
技术领域
本发明属于数据处理技术领域,尤其是涉及一种特征加权的模糊紧致散布聚类方法。
背景技术
在自然科学和社会科学中,存在着大量的分类问题,聚类方法是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法,应用领域非常广泛。模糊C-均值(FCM)聚类算法是常用的无监督模式识别方法,有很多对FCM算法的改进,其中基于特征加权的FCM(WFCM)聚类算法考虑了样本各特征参数对聚类中心的影响,改善了噪声、异常数据影响等情况。但是,这些基于FCM的聚类算法,实质都只考虑了样本的类内紧致性(类内散度),而忽略了样本类间散布性(类间散度)。Kuo-Lung Wu等人提出的FCS(Fuzzy Compactness and Separation)算法考虑了类内紧致和类间散布,并兼容了样本的硬划分和模糊划分,这更符合实际情况;国内有宋风溪等人提出了最大散度差判别准则的分类方法,该准则综合考虑类间散度和类内散度来求最优投影向量以对样本进行分类;皋军等人将模糊度引入了最大散度差判别准则提出了FMSDC(fuzzy maximum scatter difference discriminant criterion)算法,在模糊聚类的同时进行了降维;支晓斌等人指出皋军等人的算法中的错误,提出FMSDC-FCS聚类算法,该算法是皋军等人算法的正确版本,利用FCM算法初始化隶属度和样本均值,再用FMSDC算法进行降维,用FCS算法对降维数据进行聚类,其聚类实质还是采用FCS算法。
而在利用上述算法进行数据分类的过程中,我们发现,实际数据有些处于某类硬划分区域和硬划分边界上,这些数据的隶属度就不需要模糊化,这是FCM算法以及相关扩展FCM算法所不能解决的。FCS算法虽然考虑了样本硬划分问题,但是却没有考虑处于硬划分边界上的样本情况,这就导致了对实际数据进行分类时,遇到边界数据时出现分类准确度不高或运算耗时过长的问题。
发明内容
针对现有的WFCM算法在聚类时没有考虑样本硬划分实际情况,FCS算法没有考虑硬划分边界点的情况以及忽略样本特征参数对聚类影响的问题,本发明公开了一种特征加权的模糊紧致散布聚类方法。
为了达到上述目的,本发明提供如下技术方案:
一种特征加权的模糊紧致散布聚类方法,包括如下步骤:
步骤一:设置隶属度指数m、特征加权指数α∈[-10,-1]∪(1,10]、β∈{0.005,0.05,0.5,1},初始迭代次数p=0以及迭代误差ε>0,随机生成初始聚类中心ai(ai为第i类聚类中心),(c为类别数);
步骤二:根据下式计算系数ηi:
其中,为样本均值;
步骤三:根据下式更新样本隶属度μij:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410265975.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗哮喘的中药口服液及其制备方法
- 下一篇:一种治疗糖尿病的中药