[发明专利]一种MapReduce框架下的空间网络对象聚类方法在审
申请号: | 201710178623.1 | 申请日: | 2017-03-23 |
公开(公告)号: | CN107545272A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 郭黎敏;高需;丁治明;陈军成;苏醒 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 mapreduce 框架 空间 网络 对象 方法 | ||
1.一种MapReduce框架下的空间网络对象聚类方法,其特征在于,包括以下步骤:
步骤1、实现基于图生成的层次聚类框架GGHC和基于边的概略化聚类方法;
步骤2、实现基于代价的空间网络对象划分方法;
步骤3、实现MapReduce并行框架下的GGHC-MR方法。
2.如权利要求1所述的,MapReduce框架下的空间网络对象聚类方法,其特征在于,所述步骤1空间网络对象聚类算法GGHC的实现方法包括如下:
步骤1-1、寻找任一非空边上聚类,以聚类顶点表示,并为连接性聚类顶点生成相应的汇聚-连接锚点;
步骤1-2、根据汇聚-连接锚点合并聚类,若可合并,则连接性聚类顶点间存在生成图的一条边;
步骤1-3、寻找所有生成图的连通子图,标记在同一个连通子图中的对象属于相同聚类。
3.如权利要求2所述的MapReduce框架下的空间网络对象聚类方法,其特征在于,步骤1-1所述的空间网络中边上的对象进行聚类的方法包括如下:
步骤1-1-1、按照ε/2将边划分为多个概略化桶:将对象p存放在概略化桶中,此时对象间分组有序。在聚类过程中,以桶而非对象作为检索目标,减少了查询次数,仅在少数情况下依据概略化桶的性质比较桶间对象的相似性。
步骤1-1-2、依据概略化桶的性质,合并桶中对象到一个聚类顶点中;若两桶中对象属于不同聚类,则为桶中对象构造新的聚类顶点。
步骤1-1-3、判断是否有对象与边的第一个聚类顶点或最后一个聚类顶点的距离不超过ε,如果条件成立,则生成汇聚-连接锚点。
步骤1-1-4、为了提高聚类生成图子图遍历效率,分别用集合V’o和V’表示边中确定化聚类顶点和连接性聚类顶点,仅为连接性聚类顶点及生成的边构造索引,缩小索引树。
4.如权利要求3所述的MapReduce框架下的空间网络对象聚类方法,其特征在于,步骤1-1-1与步骤1-1-2所述概略化桶的性质如下:
(1)性质1.p,q∈bkti,则p,q属于同一聚类。
(2)性质2.p∈bkti,q∈bkti+1,则p,q属于同一聚类。
(3)性质3.p∈bkti,q∈bkti+2且则当Dd(Br(bkti),Bl(bkti+2))≤ε时,p,q属于同一聚类。
(4)性质4.p∈bkti,q∈bkti+2且则当Dd(Br(bkti),Bl(bkti+2))>ε时,p,q属于不同聚类。
(5)性质5.p∈bkti,q∈bkti+k且其中0<m<k,k≥3,则p,q属于不同聚类。
5.如权利要求2所述的MapReduce框架下的空间网络对象聚类方法,其特征在于,步骤1-2所述构造生成图的边的方法包括如下:
步骤1-2-1、将属于同一个汇聚顶点vi的汇聚-连接锚点按照距离聚类顶点vi的远近非递减排序;
步骤1-2-2、判断距离最小的锚点与其余锚点所含连接性聚类顶点是否存在边,若存在,则构造生成图的边;
步骤1-2-3、若汇聚顶点vi的邻接边长度不大于ε,且其上不存在对象,则生成vi邻接顶点vj的汇聚-连接锚点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710178623.1/1.html,转载请声明来源钻瓜专利网。