[发明专利]一种基于快速密度峰聚类的客观天气分型方法有效
申请号: | 202110331946.6 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113158817B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 樊仲欣 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/762 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 罗运红 |
地址: | 210044 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 快速 密度 峰聚类 客观 天气 方法 | ||
本发明提出一种基于快速密度峰聚类的客观天气分型方法,将一种新的DPC改进算法应用到天气分型中,在DPC算法仅考虑数据点密度属性和距离属性的基础上增加了数据点(天气现象)的路径属性和分布属性,并在线性增加时间复杂度的基础上获得了比DPC算法更优的效果,使本发明对于天气分型具有更高的普适性,并能够单一截断距离参数控制,自动选择特征天气类型代表性天气和分离过渡天气。
技术领域
本发明属于天气分型领域,尤其涉及一种基于快速密度峰聚类的客观天气分型方法。
背景技术
天气分型是一种通过分析若干特定气象变量来识别出特征天气类型,并将气象场分类为这些天气类型的方法。通过这种方式,天气场被分类为具有不同个体特征的不同组,而特征天气类型则代表了该组所有成员中气象要素的核心分布。由于天气类型通常与大气的动态变化过程密切相关,因此,天气分型可用于识别各种天气过程、空气污染特征等,并有助于改善气象和空气质量预报技能。传统的天气分型方法是基于人为主观判断的主观天气分型方法,该方法通过人工判断识别天气图,根据天气图中目标参数的变化特征进行分类,存在着分型结果普适性弱、主观性强、工作量大等缺点,且不同的人员分型的结果差异较大。空间天气分类法(Spatial Synoptic Classification,SSC)是一种基于地面观测的天气类型分类法,最初于20世纪90年代出现,现在已经成为实施多种气候和健康研究调查的分析工具,SSC系统运用一种名为“滑动种子日(sliding seed days)”的方法,量化研究对象城市的每种天气类型的典型气象特征,所使用的气象要素包括温度、露点温度、气压、风速和云量等,然后将每日与种子日进行比较,并将每天分类为最接近的天气类型,该方法虽然形象直观但是需要针对各气象要素预定义“种子日判定标准(seed-day selectioncriteria)”因此参数量很大。
聚类分析是进行天气分型的一种常用方法,即通过对无类别标签数据的属性(如距离、密度、分布等)进行无监督学习,从而将数据划分成多个簇,并使得簇内的数据在属性上具有高相似性,而簇间的数据则在属性上相似性低。当前聚类算法多种多样,其中最为经典的算法之一便是于2014年6月在Science上发表的DPC算法(clustering by fast searchand find of density peaks),该算法能快速(时间复杂度n2,n表示数据量)发现任意形状数据集的密度峰值点(即类簇中心),并高效进行剩余数据点分配,适用于大规模数据的聚类分析,该算法的原理基于两大原则(1)簇中心由一些局部密度比较低的点围绕(2)簇中心距离其它比自身局部密度高的点的距离都比较大。后期围绕着解决DPC算法的不足,出现了Fuzzy-DPC(Fuzzy clustering by fast search and find of density peaks)、KNN-DPC(K近邻优化的密度峰值快速搜索聚类算法)、FKNN-DPC(Robust clustering by detectingdensity peaks and assigning points based on fuzzy weighted K-nearestneighbors)等一系列的DPC改进算法,但是这些算法仅仅着眼于解决DPC算法的前期(参数形式和取值)和后期(簇中心选择,噪点分离)问题而并未对DPC算法的根本原理,即刻画簇心的决策图进行改进,因此在面对数据集中的某些极端情况,如大小簇差异显著、噪点较多,就无法获得令人满意的结果了。
因此,鉴于以上所述现有技术的不足,需要将一种新的DPC改进算法应用到天气分型中,解决现有技术参数过多,以及对于大小簇差异显著且噪点较多的数据集聚类效果不佳的问题。
发明内容
本发明将一种新的DPC改进算法应用到天气分型中,在DPC算法仅考虑数据点密度属性和距离属性的基础上增加了数据点(天气现象)的路径属性和分布属性,并在线性增加时间复杂度的基础上获得了比DPC算法更优的效果,使本发明对于天气分型具有更高的普适性,并能够单一截断距离参数控制,自动选择特征天气类型代表性天气和分离过渡天气。
技术方案:本发明提出一种基于快速密度峰聚类的客观天气分型方法,该方法包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110331946.6/2.html,转载请声明来源钻瓜专利网。