[发明专利]对数据进行聚类的方法、装置、电子设备及存储介质在审
申请号: | 202210163273.2 | 申请日: | 2022-02-22 |
公开(公告)号: | CN114548276A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 潘启灏;张鼎;黄飞;徐红艳;李永超 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 冯瑶 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 进行 方法 装置 电子设备 存储 介质 | ||
1.一种对数据进行聚类的方法,其特征在于,所述方法包括:
获取目标聚类事件的多个待聚类数据;
通过多种聚类算法分别对所述多个待聚类数据进行聚类,得到多个第一聚类结果;
对于每个第一聚类结果,确定所述第一聚类结果下所述多个待聚类数据的隶属度矩阵,所述隶属度矩阵表示在所述第一聚类结果下每个待聚类数据相对于所述第一聚类结果的每个聚簇的隶属度;
基于多个隶属度矩阵,对所述多个待聚类数据进行聚类,得到所述目标聚类事件的第二聚类结果,以确定所述多个待聚类数据的类别。
2.根据权利要求1所述的方法,其特征在于,所述对于每个第一聚类结果,确定所述第一聚类结果下所述多个待聚类数据的隶属度矩阵,包括:
对于每个所述第一聚类结果,确定所述第一聚类结果的每个聚簇的簇中心;
基于每个待聚类数据到多个簇中心的距离,确定所述待聚类数据相对于每个聚簇的隶属度;
基于每个待聚类数据相对于每个聚簇的隶属度,构建所述多个待聚类数据在所述第一聚类结果下的隶属度矩阵。
3.根据权利要求2所述的方法,其特征在于,所述基于每个待聚类数据到多个簇中心的距离,确定所述待聚类数据相对于每个聚簇的隶属度,包括:
对于每个待聚类数据,分别确定第一距离与多个第二距离的比值,所述第一距离为所述待聚类数据与任一聚簇的簇中心的距离,所述第二距离为所述待聚类数据与所述第一聚类结果的多个聚簇的簇中心的距离;
基于所述第一距离与多个第二距离的比值之和与隶属度因子,确定所述待聚类数据相对于所述任一聚簇的隶属度。
4.根据权利要求2所述的方法,其特征在于,所述对于每个所述第一聚类结果,确定所述第一聚类结果的每个聚簇的簇中心,包括:
对于每个聚簇,基于所述聚簇中的待聚类数据的平均值,确定所述聚簇的簇中心。
5.根据权利要求1所述的方法,其特征在于,所述通过多种聚类算法分别对所述多个待聚类数据进行聚类,得到多个第一聚类结果,包括:
基于所述多个待聚类数据,确定所述多种聚类算法的初始参数;
基于所述初始参数,通过所述多个聚类算法,分别对所述多个待聚类数据进行聚类,得到所述多个第一聚类结果。
6.根据权利要求1所述的方法,其特征在于,所述基于多个隶属度矩阵,对所述多个待聚类数据进行聚类,包括:
基于每个第一聚类结果中聚簇的数量,将所述多个第一聚类结果下的隶属度矩阵进行融合,得到融合矩阵;
基于所述融合矩阵,对所述多个待聚类数据进行聚类,得到所述第二聚类结果。
7.根据权利要求6所述的方法,其特征在于,所述基于多个隶属度矩阵,对所述多个待聚类数据进行聚类之前,所述方法还包括:
基于所述目标事件,确定所述多个隶属度矩阵的权重;
所述基于每个第一聚类结果中聚簇的数量,将所述多个第一聚类结果下的隶属度矩阵进行融合,得到融合矩阵,包括:
基于所述多个隶属度矩阵的权重和每个第一聚类结果中聚簇的数量,将所述多个第一聚类结果下的隶属度矩阵进行融合,得到融合矩阵。
8.一种对数据进行聚类的装置,其特征在于,所述装置包括:
获取模块,用于获取目标聚类事件的多个待聚类数据;
第一聚类模块,用于通过多种聚类算法分别对所述多个待聚类数据进行聚类,得到多个第一聚类结果;
确定模块,用于对于每个第一聚类结果,确定所述第一聚类结果下所述多个待聚类数据的隶属度矩阵,所述隶属度矩阵表示在所述第一聚类结果下每个待聚类数据相对于所述第一聚类结果的每个聚簇的隶属度;
第二聚类模块,用于基于多个隶属度矩阵,对所述多个待聚类数据进行聚类,得到所述目标聚类事件的第二聚类结果,以确定所述多个待聚类数据的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210163273.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置