[发明专利]信息粒导向变相动态快速聚类算法在审
申请号: | 201710157233.6 | 申请日: | 2017-03-16 |
公开(公告)号: | CN108629352A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 徐楷杰;李志武;聂卫科;朱修彬;尹雨山 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 李郑建 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 矢量 粒相 快速聚类算法 运算复杂度 平移 参数调整 高维数据 构造信息 压缩处理 影响算法 标准差 降维 赋予 | ||
本发明公开了一种导向变相动态快速聚类算法,首先对信息粒数据作平移标准差变换,然后构造信息粒相矢量;最后对信息粒相矢量进行聚类;本发明对信息粒数据进行导向压缩处理,赋予信息粒以相信息,对信息粒相矢量进行聚类,可以使高维数据降维,且通过参数调整可以提高调整聚类性能而不影响算法运算复杂度。使其更快聚类,提高了聚类效果。
技术领域
本发明属于大数据技术研究领域,具体涉及一种有效的导向变相动态快速聚类算法,以提高聚类性能。
背景技术
在大数据时代,如何充分挖掘出蕴藏于数据资源中的价值正在成为各国 IT业界、学术界和政府共同关注的焦点。数据挖掘中应用最为广泛的经典聚类算法之一的kmeans算法一直以来倍受学者们的青睐,针对kmeans算法自身的缺陷,如受迭代次数影响、受初始化中心的影响,当处理实际应用领域的复杂高维数据时,将会出现运算量大、收敛速度慢,不稳定的缺陷。
发明内容
针对上述现有技术存在的不足,本发明的目的在于提供一种信息粒导向变相动态快速聚类算法,更快聚类,提高了聚类效果,聚类稳定可调;解决现有的聚类算法运算量大、收敛速度慢,不稳定的缺陷。
为解决上述技术问题,本发明采用了以下技术方案:
一种导向变相动态快速聚类算法,包括以下步骤:
步骤一:对信息粒数据D作平移标准差变换,得到
信息粒数据D为:
变换之后的信息粒数据为:
其中,
xnm表示第n个数据的第m个属性,x′nm表示经平移标准差变换后的第 n个数据的第m个属性,N表示信息粒数据的个数,每个数据有M个属性;
步骤二:构造信息粒相矢量;
步骤2.1:信息粒数据的导向矢量Ξ为:
其中,Ω为信息粒的导向压缩矢量,Λ为信息粒的导向压缩变换矢量,Λ=[cosθ1 cosθ2 … cosθm … cosθM]T,且满足θm表示波长为λ的平行波辐射在信息粒上时该平行波束与M维空间标准正交坐标轴的正向夹角,m=1,2,...,M;
步骤2.2:相矢量Ψ分布在单位圆上,相矢量中每一个元素为信息粒的一个相,相矢量中一个相对应单位圆上的一个点,相矢量Ψ的表达式为:Ψ=ejΞ,其中,
步骤三:对信息粒相矢量进行聚类;
对相矢量Ψ在单位圆上形成的点进行聚类,获得K个类簇,K>1。
本发明还具有如下区别技术特征:
所述的步骤二至步骤三中,平行波的波长λ为λ≥max(Ω)的变量。
所述的步骤三中,使用K-means聚类算法对相矢量Ψ在单位圆上形成的点进行聚类。
本发明的有益效果:
本发明对信息粒数据进行导向压缩处理,赋予信息粒以相信息,对信息粒相矢量进行聚类,可以使高维数据降维,且通过参数调整可以提高调整聚类性能而不影响算法运算复杂度。使其更快聚类,提高了聚类效果;聚类稳定可调,更适合实际应用。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710157233.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据模型处理方法及其装置
- 下一篇:信息粒导向压缩快速聚类算法