[发明专利]基于分子内聚力理论的数据聚类方法无效
| 申请号: | 201110032779.1 | 申请日: | 2011-01-30 |
| 公开(公告)号: | CN102087667A | 公开(公告)日: | 2011-06-08 |
| 发明(设计)人: | 余春艳;张栋;王秀;姜云飞;李建明 | 申请(专利权)人: | 福州大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
| 地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 分子 内聚力 理论 数据 方法 | ||
1.一种基于分子内聚力理论的数据聚类方法,其特征在于:对于高维空间上具有N个数据点的数据集,设每个数据点为一个分子,设多个数据点形成的一个聚类为一个分子团,基于分子内聚力理论按如下步骤进行数据聚类:
步骤(1):利用分子势能公式分别计算两两数据点之间的内聚力能量值,并保存;
步骤(2):各数据点并行寻找能使合并总能量降低且降到最低的数据点,与其合并为一个聚类,根据聚类完成的先后顺序,当一个数据点A被另一数据点B合并为一个聚类后,所述数据点A不再主动寻找与其聚类的数据点,也不再以单个数据点形式作为其他数据点的聚类选择对象;通过该步骤得到多个聚类和未找到使合并总能量降低数据点而无法聚类的数据点;
步骤(3):步骤(2)得到的各数据点和聚类并行寻找能使合并总能量降低且降到最低的数据点或聚类,与其合并为一个新的聚类,根据聚类完成的先后顺序,当一个数据点或聚类C被另一数据点或聚类D合并为一个新的聚类后,所述数据点或聚类C不再主动寻找与其聚类的数据点或聚类,也不再以原形式作为其他数据点或聚类的聚类选择对象;
步骤(4):重复步骤(3),直至所有数据点或聚类都无法使其他数据点或聚类能量降低;
步骤(5):所有数据点聚类完成,并得到数据点最终的类簇及其类别数目。
2.根据权利要求1所述的基于分子内聚力理论的数据聚类方法,其特征在于:两两数据点之间的内聚力能量值的计算公式为:
其中,表示φ(r)表示数据点之间的内聚力能量值,表示数据点之间的斥力,表示数据点之间的引力,r表示数据点之间的距离,A、B、n、m是大于零的恒量,且n >m。
3.根据权利要求1或2所述的基于分子内聚力理论的数据聚类方法,其特征在于:一个数据点或聚类加入新的数据点后总能量值的计算公式为:
其中,Etotal表示总能量值,φij(rij)表示数据点i与数据点j之间的内聚力能量值,U表示数据点或聚类未加入新的数据点前的能量值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110032779.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种软件重用模块的保护方法及装置
- 下一篇:一种新闻评论页面的爬取方法及系统





