[发明专利]一种利用GPU加速密度峰聚类的方法有效

专利信息
申请号: 202010811897.1 申请日: 2020-08-13
公开(公告)号: CN112052879B 公开(公告)日: 2023-06-13
发明(设计)人: 苏雨萱;张岩峰;宛长义;于戈 申请(专利权)人: 东北大学
主分类号: G06F18/23 分类号: G06F18/23;G06F9/50;G06F18/2431;G06F18/2321
代理公司: 大连理工大学专利中心 21200 代理人: 戴风友;梅洪玉
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 利用 gpu 加速 密度 峰聚类 方法
【权利要求书】:

1.一种利用GPU加速密度峰聚类的方法,其特征在于,步骤如下:

步骤1:在GPU上构建制高点树VP-Tree(vantage point tree)的索引结构;

步骤1.1:从上到下选出制高点树每层的制高点;先从所有数据点随机选出一个点,然后计算出距离该点最远的点最为制高点树的根节点;

步骤1.2:计算每个点与制高点的距离,按照距离的大小排序后等分成两部分,距离的中值M作为根节点对应的查询半径;

步骤1.3:分别选择左右子树的最后一个点,即距离上一层制高点最远的点,做为下一层的制高点;

步骤1.4:重复步骤1.2和1.3,直到当前分支内点的数量不大于32个,把这些点的序号储存到同一个数组内作为叶子节点;

步骤2:利用步骤1中的制高点树索引计算每个数据点的密度值;

步骤2.1:给GPU每个warp分配一个点进行并行处理,构建栈结构来储存待访问节点,把制高点树的根节点入栈,给定的dc值作为查询半径;其中warp为32个线程一组;

步骤2.2:弹出栈顶元素,如果是分支节点,则计算待查询点与当前制高点的距离r,如果r-dc≤M,则把左子树根节点入栈;如果r+dc≥M, 则把右子树根节点入栈;如果是叶子节点,则加入待筛选的点集;

步骤2.3:重复步骤2.2,直到栈空;

步骤2.4:计算待筛选点集中与当前点距离不超过dc的点数量作为该点的密度;

步骤3:利用步骤2中的每个数据点的密度值和制高点树索引计算每个数据点的斥群值;

步骤3.1:利用步骤2中得到每个点的密度值,选出每个点P的待筛选点集中密度比该点大且距离最近的点;若存在,则这个点作为点P的依赖点,距离值作为点P的斥群值;若不存在,则把点P加入到未找到依赖点的集合中;

步骤3.2:根据每个点的密度值对所有点进行从大到小排序;

步骤3.3:根据密度值对未找到依赖点集合中的点进行从大到小排序;其中,密度值最大的点选择数据集中距离自己最远的点作为依赖点,距离值作为斥群值;其他点在步骤3.2中得到的序列中,找到密度值比自己大,且距离最近的点作为依赖点,距离值作为斥群值;

步骤4:利用每个数据点的密度值和斥群值,构建决策图后由用户根据聚类中心的密度值和斥群值同时较大的原则选出聚类中心点;

步骤5:利用步骤3中得到每个点的依赖点,构建被依赖关系,然后从步骤4中用户选出的聚类中心点开始分配每个点所属的聚类。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010811897.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top