[发明专利]一种两阶段混合粒子群优化聚类方法有效

专利信息
申请号: 201210109141.8 申请日: 2012-04-13
公开(公告)号: CN102663100A 公开(公告)日: 2012-09-12
发明(设计)人: 刘志镜;王纵虎;王韦桦;陈东辉;屈鉴铭;贺文骅;王静;姚勇;熊静;唐国良;袁通;刘慧 申请(专利权)人: 西安电子科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 陕西电子工业专利中心 61205 代理人: 田文英;王品华
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 阶段 混合 粒子 优化 方法
【权利要求书】:

1.一种两阶段混合粒子群优化聚类方法,包括如下步骤:

(1)读入数据集和聚类个数K;

(2)统计维度信息

计算机遍历数据集所有样本,统计数据集各维的取值范围信息,获得数据集各维属性取值范围的最大值与最小值;

(3)维度规范化

对数据样本各维属性值采用规范化公式进行处理,将数据集所有样本各维属性值映射到[0,1]区间;

(4)计算相似度矩阵

对所有样本采用欧式距离公式计算两两之间的相异度值,生成数据集各样本之间的相异度矩阵;

(5)生成候选初始聚类中心

5a)将所有样本看作一个子簇,加入当前轮子簇列表中,根据步骤(4)中获得的相互之间的相异度降序排序;

5b)按照平均相异度公式计算当前轮子簇列表中每个子簇与数据集其他子簇之间的平均相异度值;

5c)对排序后的子簇对进行合并,若子簇对之间的相异度同时小于子簇对中两个子簇的平均相异度值,则将这两个子簇进行合并,加入到新一轮子簇列表中,否则将这两个子簇加入新一轮子簇列表中;

5d)判断新一轮子簇列表中子簇的数目是否小于等于预定数目,若是,则停止迭代,输出生成的新一轮子簇列表中的子簇作为候选初始聚类中心;否则返回5b)继续进行层次凝聚聚类;

(6)粒子群K均值划分聚类

6a)采用粒子编码方式对选择的新一轮子簇列表中的子簇中的候选初始聚类中心子簇进行编码;

6b)设定粒子种群中粒子的数目及最大迭代次数、整个粒子种群的位置和速度的搜索空间范围,设定每个粒子的初始位置和速度;

6c)根据当前粒子编码位置各维的值获得初始聚类中心子簇的序号,采用K均值划分方法对数据集进行划分聚类,获得数据集的聚类结果;

6d)根据适应度值公式,对数据集聚类结果计算粒子的适应度值;

6e)判断当前粒子适应度值与该粒子的最优适应度值的大小,若小于则将该粒子最优适应度值用当前粒子适应度值替换,将该粒子最优位置用当前粒子位置替换,否则不变;

6f)判断当前粒子适应度值与粒子种群的最优适应度值的大小,若小于则将粒子种群最优适应度值用当前粒子适应度值替换,将粒子种群最优位置用当前粒子位置替换,否则不变;

6g)根据粒子速度更新公式更新粒子速度;

6h)根据粒子位置更新公式更新粒子位置;

6i)判断粒子群优化迭代次数是否到达预设的最大迭代次数,若是,则停止迭代,执行步骤(7);否则,返回6c)继续进行计算;

(7)输出粒子种群最优适应度值和对应的数据集类簇划分结果。

2.根据权利1所述的一种两阶段混合粒子群优化聚类方法,其特征在于,步骤(3)所述的规范化公式如下:

f=f-minfmaxf-minf]]>

其中,f′为样本某一维属性经过规范化后映射到[0,1]范围内的值,f为样本某一维属性原始值,minf为数据集中样本某一维属性f的最小值,maxf为数据集中样本某一维属性f的最大值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210109141.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top