[发明专利]一种最大熵证据C均值聚类方法在审
申请号: | 202110624768.6 | 申请日: | 2021-06-04 |
公开(公告)号: | CN113283523A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 焦连猛;王丰;杨浩宇;马皓楠;刘准钆;梁彦;潘泉 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 最大 证据 均值 方法 | ||
1.一种最大熵证据C均值聚类方法,其特征在于,包括以下步骤:
步骤1:在ECM算法的目标函数中加入熵约束条件;
步骤1-1:ECM是基于置信划分的一种聚类算法,即利用定义在集合Ω={ω1,........ωc}上的基本置信隶属函数mi来表示对象i的类别;对于每个对象i,当i和焦点Aj间的距离dij越远时,mij=mi(Aj)的值越小;每个类ωk用一个vk表示;
定义:
与Aj相关联的重心通过下式计算:
其中cj=|Aj|是Aj的势;
对象i与任一重心的距离定义如下:
根据以上定义,最小化如下ECM的目标函数来寻找置信划分和聚类中心V∈Rc×p:
其中,n是样本的总个数,p为样本特征数目,mij表示样本i属于焦点Aj的置信度,miΦ表示样本i属于空集的置信度,δ控制作为离群值的数据量,α和β是加权指数;
步骤1-2:在ECM算法的目标函数中加入新的信息熵,由如下式定义:
其中,Hb(m)表示信息熵,Hb(m)满足DS定理理论语义一致性、非负性、单调性、概率一致性、可加性性质;m表示基本置信隶属函数,x表示某一样本,Ω表示类集合,a表示Ω的任一子集,m(a)表示样本x属于a的置信度;
步骤1-3:设定两部分熵值,加入到置信聚类方法的约束函数,得到基于证据熵的模糊聚类方法MEECM;目标函数被写为
且函数必须满足条件
其中,η是加权指数;
步骤2:针对条件极值问题使用拉格朗日乘子法,引入n个拉格朗日因子,再对各个变量求导,得到各个变量的极值点;
步骤2-1:用拉格朗日法对函数进行求解,引入n个拉格朗日乘子:
步骤2-2:对聚类置信度mij求导:
式(9)中间部分由于不含求导项,因此求偏导为0:
步骤2-3:对反置信度miΦ求导:
式(11)第一部分不含求导项,因此偏导为0:
步骤2-4:对拉格朗日乘子求偏导,得到:
由此得出显式解:
进一步得到
再代入式(14):
步骤2-5:对聚类中心Vl求导:
令该偏导数等于零得到:
设立维度为c×p的矩阵B为储存矩阵,:
设立尺寸为c×c的矩阵H:
则有:
HV=B (25)
步骤3:由步骤2不断对各参数进行迭代,当满足:
|JMEECM(t)-JMEECM(t-1)|ε时,迭代结束,从而完成了聚类工作;阈值ε为预设值。
2.根据权利要求1所述的一种最大熵证据C均值聚类方法,其特征在于,所述阈值ε取10-6。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110624768.6/1.html,转载请声明来源钻瓜专利网。