[发明专利]对数据进行聚类的方法、装置、电子设备及存储介质在审
申请号: | 202210163273.2 | 申请日: | 2022-02-22 |
公开(公告)号: | CN114548276A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 潘启灏;张鼎;黄飞;徐红艳;李永超 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 冯瑶 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 进行 方法 装置 电子设备 存储 介质 | ||
本申请涉及一种对数据进行聚类的方法、装置、电子设备及存储介质,属于数据处理技术领域。该方法包括:获取目标聚类事件的多个待聚类数据;通过多种聚类算法分别对多个待聚类数据进行聚类,得到多个第一聚类结果;对于每个第一聚类结果,确定第一聚类结果下多个待聚类数据的隶属度矩阵,隶属度矩阵表示在第一聚类结果下每个待聚类数据相对于第一聚类结果的每个聚簇的隶属度;基于多个隶属度矩阵,对多个待聚类数据进行聚类,得到目标聚类事件的第二聚类结果,以确定多个待聚类数据的类别。这样基于融合了待聚类数据的多种划分信息的隶属度矩阵对多个待聚类数据再次进行聚类,保留了更多的划分信息,避免了单个聚类算法对数据结构不适应的问题。
技术领域
本申请实施例涉及数据处理技术领域,特别涉及一种对数据进行聚类的方法、装置、电子设备及存储介质。
背景技术
随着数据处理技术的发展,数据收集手段逐渐成熟,收集到的数据大量增加。随着收集的数据大量增加,从收集到的数据中提取有用的信息来解释这些数据成为了最困难的问题。而对数据进行聚类能够揭示数据和特征之间的内部关系,在提取信息的过程中发挥着重要作用。
相关技术中,已经开发了许多聚类算法来处理不同的问题。例如,划分式聚类、密度聚类或层次聚类等。这些聚类算法使用不同的距离或相似性作为度量参数,使用不同的目标函数进行衡量。不同的聚类算法对于同一数据集会产生不同的聚类结果,且对于有着不同数据结构的数据集往往表现出不同的性能。因此,在对数据进行聚类时,需要选择对应的聚类方法进行聚类。
上述相关技术中,一旦聚类算法选定,初始化参数对聚类结果有重大影响。因此,在聚类过程中选择合适的聚类算法以及各种参数是困难的。因此,亟需一种新的聚类方法。
发明内容
本申请实施例提供了一种对数据进行聚类的方法、装置、电子设备及存储介质,避免了单个聚类算法对数据结构不适应的问题。所述技术方案如下:
一方面,提供了一种对数据进行聚类的方法,所述方法包括:
获取目标聚类事件的多个待聚类数据;
通过多种聚类算法分别对所述多个待聚类数据进行聚类,得到多个第一聚类结果;
对于每个第一聚类结果,确定所述第一聚类结果下所述多个待聚类数据的隶属度矩阵,所述隶属度矩阵表示在所述第一聚类结果下每个待聚类数据相对于所述第一聚类结果的每个聚簇的隶属度;
基于多个隶属度矩阵,对所述多个待聚类数据进行聚类,得到所述目标聚类事件的第二聚类结果,以确定所述多个待聚类数据的类别。
另一方面,提供了一种对数据进行聚类的装置,所述装置包括:
获取模块,用于获取目标聚类事件的多个待聚类数据;
第一聚类模块,用于通过多种聚类算法分别对所述多个待聚类数据进行聚类,得到多个第一聚类结果;
确定模块,用于对于每个第一聚类结果,确定所述第一聚类结果下所述多个待聚类数据的隶属度矩阵,所述隶属度矩阵表示在所述第一聚类结果下每个待聚类数据相对于所述第一聚类结果的每个聚簇的隶属度;
第二聚类模块,用于基于多个隶属度矩阵,对所述多个待聚类数据进行聚类,得到所述目标聚类事件的第二聚类结果,以确定所述多个待聚类数据的类别。
另一方面,提供了一种电子设备,所述电子设备包括处理器和存储器;所述存储器存储有至少一条程序代码,所述至少一条程序代码用于被所述处理器执行以实现如上述方面所述的对数据进行聚类的方法。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有至少一条程序代码,所述至少一条程序代码用于被处理器执行以实现如上述方面所述的对数据进行聚类的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210163273.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置