[发明专利]聚类方法和设备无效
| 申请号: | 200910203452.9 | 申请日: | 2009-05-21 |
| 公开(公告)号: | CN101556621A | 公开(公告)日: | 2009-10-14 |
| 发明(设计)人: | 曹先彬;汪中;许言午;李彤;宁博;林人俊;吴长侠 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京市德恒律师事务所 | 代理人: | 张大威 |
| 地址: | 230026*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 方法 设备 | ||
技术领域
本发明涉及数据挖掘领域,更具体地涉及聚类方法。
背景技术
作为数据挖掘的重要组成部分,聚类分析在处理大规模数据中成为不可或缺的重要工具。聚类分析是一种重要的人类活动。通过适当聚类,事物才便于研究,事物的内部规律才可能为人类所掌握。在很多应用中,聚类分析作为一种数据预处理过程,是进一步分析和处理数据的基础。聚类分析已经广泛地用于许多应用领域,包括市场研究、模式识别、数据分析和图像处理。聚类可以帮助市场分析人员根据购买模式从顾客中发现不同的顾客群。在生物学中,聚类能用来推导植物和动物分类,根据相似功能进行分类。但是,传统的聚类算法对样本的分布形状敏感,不能满足大规模数据集和不同样本形状的需求。
发明内容
为了解决上述问题之一,本发明提出了一种聚类方法,包括以下步骤:在数据集中选取聚类中心,对于每个所述聚类中心确定特征点集合;根据所述特征点集合将所述数据集中的数据划分到聚类中;根据所述划分到聚类中的数据与所述特征点集合的关系确定新的特征点集合;根据所述新的特征点集合确定聚类结果。
根据本发明的实施例,确定新的特征点集合的步骤包括:根据所述数据与所述特征点集合的关系确定所述特征点集合中的特征点的修正值;根据所述特征点的当前值与所述特征点的修正值确定新的特征点。
根据本发明的实施例,根据所述数据与所述特征点集合的关系确定新的特征点集合的步骤之后还包括:判断所述新的特征点集合与之前的特征点集合中的特征点的值是否相同;如果所述新的特征点集合与之前的特征点集合中的特征点的值相同,则根据所述新的特征点集合确定聚类结果;如果所述新的特征点集合与之前的特征点集合中的特征点的值不同,则重复根据所述新的特征点集合将所述数据划分到聚类中的步骤以及确定新的特征点集合的步骤。
根据本发明的实施例,根据所述特征点集合将所述数据集中的数据划分到聚类中的步骤包括:计算所述数据与所述特征点集合的加权距离;将所述数据划分到所述加权距离最小的聚类。
根据本发明的实施例,计算所述数据与所述特征点集合的加权距离的步骤包括:根据离散系数确定所述数据与所述特征点的距离的权值。
根据本发明的实施例,所述数据与所述特征点的距离d的权值根据以下公式得出:w(d)=e-F×d,其中d为数据与特征点的距离,F为所述离散系数,w(d)为所述数据与所述特征点的距离的权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910203452.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:氧化锆-莫来石复合材料的制备方法
- 下一篇:一种包装板





