[发明专利]一种基于数据场的时空数据流聚类方法在审
申请号: | 201910526628.8 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110347766A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 秦昆;顾英哲;徐雯婷;徐源泉;宋时丞 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06K9/62;G06F16/2455 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于数据场的时空数据流聚类方法,首先将研究区域按网格进行划分,在新数据到达时,根据其属性值分配到对应的网格单元中,并加入网格的缓存列表。每过一个计算间隔,会对网格的历史质量进行衰减,并通过数据场方法对网格的新质量进行计算,进而对网格势值和数据场参数进行更新,最后通过网格状态的变化情况对聚类结果进行动态调整。本发明将数据场理论引入数据流聚类当中,改善了传统的数据流聚类算法难以感知数据间相关性的不足,本方能够对时空数据流进行有效的动态聚类,从而应用在城市热点动态探测等时空数据挖掘场景中。 | ||
搜索关键词: | 数据场 网格 时空数据流 聚类 数据流 缓存 动态调整 动态聚类 动态探测 感知数据 聚类结果 聚类算法 时空数据 网格单元 网格状态 研究区域 传统的 新数据 衰减 场景 挖掘 引入 分配 更新 应用 | ||
【主权项】:
1.一种基于数据场的时空数据流聚类方法,其特征在于,包括以下步骤:步骤1:将研究区域划分为均匀大小的网格单元,每个网格均保存一个特征向量v,其中v=(M,P,label,status),分别表示上一次更新时网格的质量、势值、类簇标签和网格类型;所述网格类型根据势值大小和势值阈值分为稀疏网格、转换网格和密集网格,其中势值阈值共分为两级:Dl和Dm,当网格势值小于Dl时,为稀疏网格,当势值大于Dm时为密集网格,否则为转换网格;步骤2:实时判断时空数据流中是否有新的数据项到达;当时空数据流中有新的数据项到达时,找到数据项对应网格,并加入该网格的缓存列表中;步骤3:每隔一个gapon时间,对每个网格的特征向量v中的网格质量、网格势值和网格类型进行更新;步骤4:对势值阈值和数据场参数σ进行调整,能动态适应数据的最新情况;步骤5:每隔一个gapoff时间,对聚类结果进行调整。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910526628.8/,转载请声明来源钻瓜专利网。