[发明专利]一种基于熵和距离加权的多视角模糊聚类算法在审
申请号: | 201910723342.9 | 申请日: | 2019-08-06 |
公开(公告)号: | CN110503138A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 孙冬璞;祁光宇 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150000 黑龙*** | 国省代码: | 黑龙;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多视角 加权 模糊聚类算法 加权算术 聚类结果 隶属度 视角 逼近 聚类算法 有效地 聚类 权重 算法 替代 赋予 | ||
本发明公开了一种基于熵和距离加权的多视角模糊聚类算法,要解决的是现有多视角聚类算法中的不足。本发明具体步骤如下:步骤一,在FCM模型的多视角模糊聚类算法的基础上,提出基于Havrda‑Charvat熵的异视角空间划分逼近准则;步骤二,提出距离加权的方法;步骤三,采用隶属度的加权算术平方值来替代平均值作为最后的结果。本发明用Havrda‑Charvat熵构造出新的异视角空间划分逼近准则,提高了算法性能;本发明采用基于距离加权的方法,通过给不同属性赋予不同的重要性,可以有效地降低对聚类结果不好的属性所占的比重,提高对聚类结果好的属性所占的比重;本发明采用隶属度的加权算术平方值作为最后的结果,将最佳视角的权重调大,结果更加的理想,聚类效果更好。
技术领域
本发明涉及多角度学习领域,具体是一种基于熵和距离加权的多视角模糊聚类算法。
背景技术
20世纪80年代末期出现的数据挖掘技术,随着科学技术的进步,在90年代有了突飞猛进的发展。数据挖掘涉及到机器学习,模式识别等多个领域,它的提出让人们发现蕴藏在数据中的信息和知识,而这些知识是隐含的、事先未知的有用信息。另外,数据挖掘技术在其他行业也有很好的应用。当人们用数据挖掘技术对数据中的关系进行分析时,通常是用聚类算法研究数据之间的相互关系。
聚类是数据挖掘的重要技术,它在实际中主要用来挖掘有用的信息进行分析得到有用的结果。聚类是将不同的数据对象划分成不同的类,使得每一类中的对象尽可能相同,而不同类中的对象尽可能不同。同时聚类也是数据分析的基础,它在图像处理、数据挖掘、信息检索,模式识别等各个领域有着广泛的应用,是目前机器学习和人工智能主要研究方向。聚类分析作为聚类的一种重要的无监督学习工具,在数据挖掘中占有重要的地位,它在分析数据对象时不需要事先确定分类准则,而是通过将相似的对象聚集在一起形成聚类来发现数据之间的内部结构。聚类算法是聚类分析研究的核心,在人工智能和机器学习中得到了广泛的研究。目前已经提出了基于划分和基于层次的聚类算法,其中基于划分的聚类算法是最常用的聚类算法,同时又叫基于目标函数的聚类算法。这些算法都是解决数据的单视角的聚类问题,在解决单视角聚类有很大的优势。
但是在实际的生活中,数据的表示不是单一的一种形式,它可以有多种表现形式,例如一个文本可以用多种语言表示,一张图片可以用文字、颜色和形状等来表示,也可以在测试人的血液时,用不同的测量指标作为分析依据,这些数据的聚类结果都是从不同的视角中得到基本一致的结果。此外,也有一些数据是由不同结构组成的数据。虽然这些数据来自同样的数据源并且采样的对象是一样的,但是它们是从不同的视角进行采样的。多视角数据在各个领域都有很广泛的应用。特别是在医学方面,对有核红细胞通常通过密度、几何特征、颜色和纹理等不同的角度来进行描述,每个视角代表了一种特定的度量值。这些多视角数据依据数据多方面的特征进行聚类的方法称为多视角聚类。多视角聚类技术是通过对同一对象的不同特征所构造的数据样本进行分析,并利用各视角间的协同又称作交互式的处理模式找出视角间的相似性成分,进而得到一个趋于一致性的全局决策结果。由于该技术全面地考虑了被研究对象在各个视角下所存在的特征信息因而在求同存异的指导思想下,所得到的决策结果要比传统的仅基于单一视角特征空间所得到的决策结果更为全面、可靠。
近年来,许多专家和科研人员对多视角数据集的聚类问题产生了极大的兴趣,并提出了一系列的新算法。Wang等人提出了增强的聚类算法,利用数据属性之间的相关性进行聚类。Bickel等人提出了多视角聚类算法,将每个视角单独进行K-means聚类,再将每个视角的聚类标号提供给其他视角使用。2005年,Bickel等人又提出了基于Co-EM的混合统计模型,在最大期望(expectationmaximization,EM)算法法的基础上引入了多视角机制。Tong等人把拉普拉斯特征映射进行降维的方法引入到谱聚类算法中,提出了基于谱聚类的多视角聚类算法。2009年,Cleuziou等人提出了中心化模糊聚类(CoFKM)算法,对各个视角得到的聚类结果给出了新的融合策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910723342.9/2.html,转载请声明来源钻瓜专利网。