[发明专利]样本聚类方法、装置、设备及存储介质在审
申请号: | 201910551643.8 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110276401A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 熊凯 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 样本距离 聚类 存储介质 样本聚类 数据处理领域 计算距离 连接关系 样本集合 样本集 样本数 算法 扫描 统计 | ||
1.一种样本聚类方法,其特征在于,包括:
统计样本集中每个样本对应的第一样本距离,所述第一样本距离为所述样本与所述样本的第S近邻样本之间的距离;
在全部所述第一样本距离中,获取设定距离范围内的第一样本距离;
基于所述设定距离范围内的第一样本距离计算距离均值;
基于每个所述样本对应的K近邻样本集合,确定每个样本的全部连接样本,其中,K>S,所述样本与所述样本的连接样本为互为近邻样本且存在连接关系;
根据所述连接样本、所述距离均值和S值对所述样本集中的样本进行聚类,所述距离均值为扫描半径,所述S值为聚类最小包含样本数。
2.根据权利要求1所述的样本聚类方法,其特征在于,所述根据所述连接样本、所述距离均值和S值对所述样本集中的样本进行聚类包括:
基于所述距离均值对全部所述连接样本进行过滤,以滤除第二样本距离大于所述距离均值的连接样本,所述第二样本距离为样本与所述样本的连接样本之间的距离;
基于S值和过滤后得到的连接样本对所述样本集中的样本进行聚类。
3.根据权利要求2所述的样本聚类方法,其特征在于,所述基于S值和过滤后得到的连接样本对所述样本集中的样本进行聚类包括:
依次统计每个样本的连接样本总数量;
将所述连接样本总数量大于S值的样本作为核心样本;
在得到的全部核心样本中,选择任一核心样本作为当前样本;
访问所述当前样本的全部连接样本;
将访问得到的每个连接样本分别作为顶点,并访问所述顶点对应的全部连接样本;
重复将访问得到的每个连接样本分别作为顶点,并访问所述顶点对应的全部连接样本的操作,直到访问不到新的连接样本为止;
将未被访问过的任一核心样本更新为当前样本,并返回执行访问所述当前样本的全部连接样本的操作,直到全部核心样本均被访问为止;
将所述当前样本及基于当前样本访问得到的连接样本聚类为簇。
4.根据权利要求1所述的样本聚类方法,其特征在于,所述基于每个所述样本对应的K近邻样本集合,确定每个样本的全部连接样本包括:
获取每个样本对应的K近邻样本集合;
根据全部所述K近邻样本集合,构建邻接矩阵,所述邻接矩阵中每个元素代表对应两个样本间的近邻关系;
统计所述邻接矩阵中非零元素,以确定每个样本的全部连接样本。
5.根据权利要求4所述的样本聚类方法,其特征在于,所述统计所述邻接矩阵中非零元素,以确定每个样本的全部连接样本包括:
在所述邻接矩阵中,获取处于对称位置的元素组,所述元素组包括第i行第j列的第一元素和第j行第i列的第二元素;
若所述第一元素和所述第二元素中包含至少一个零元素,则将所述第一元素和第二元素均设置为零元素;
遍历所述邻接矩阵的全部元素组后,更新所述邻接矩阵;
统计更新后的邻接矩阵中非零元素,并将所述非零元素对应的两个样本确定为互为近邻样本且具有连接关系;
基于所述互为近邻样本,得到每个样本的全部连接样本。
6.根据权利要求1所述的样本聚类方法,其特征在于,所述在全部所述第一样本距离中,获取设定距离范围内的第一样本距离包括:
基于全部所述第一样本距离,构建频数分布直方图;
统计所述频数分布直方图中各bin的频数,以确定设定距离范围;
获取设定距离范围内的第一样本距离。
7.根据权利要求6所述的样本聚类方法,其特征在于,所述统计所述频数分布直方图中各bin的频数,以确定设定距离范围包括:
获取所述频数分布直方图中频数最大bin;
计算相邻后位bin之间的频数落差,所述后位bin为所述频数分布直方图中位于频数最大bin后方的bin;
确认频数落差最大的相邻后位bin,并在所述最大的相邻后位bin中选择位于后方的bin;
将所述频数最大bin对应的第一样本距离和所述位于后方的bin对应的第一样本距离作为设定距离范围的距离阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910551643.8/1.html,转载请声明来源钻瓜专利网。