[发明专利]基于主成分分析的多元水文时间序列匹配模型构建方法在审

专利信息
申请号: 201711210985.0 申请日: 2017-11-28
公开(公告)号: CN107944146A 公开(公告)日: 2018-04-20
发明(设计)人: 娄渊胜;盖振;叶枫;孙建树 申请(专利权)人: 河海大学
主分类号: G06F17/50 分类号: G06F17/50;G06F17/30
代理公司: 南京苏高专利商标事务所(普通合伙)32204 代理人: 李玉平
地址: 210098 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 成分 分析 多元 水文 时间 序列 匹配 模型 构建 方法
【说明书】:

技术领域

发明涉及一种基于数据挖掘和水文时间序列相似性匹配的模型构建方法,具体地说,是一种对多元水文时间序列进行相似性匹配的方法,从历史水文时间序列中匹配出与给定时间序列最相似的序列。

背景技术

随着信息技术的发展,水文数据的种类和数量急剧增加,逐渐呈现出多元、大量和多态的特征。根据多元水文时间序列的特点,选用高效的数据挖掘算法,从大量的水文时间序列数据中提取有用的信息和知识,为解决水文领域的突出问题提供新的分析方法和科学的决策支持。

传统水文数据挖掘方法面对如今数量巨大、类型复杂的水文数据资料,往往显得无能为力。目前对于水文时间序列的研究大多是基于一元水文时间序列,由于多元水文时间序列不同维度之间的复杂联系,其研究工作开展得相对缓慢,目前很多工作还处于起步阶段。

发明内容

发明目的:针对现有的多元水文时间序相似性匹配方法效率和准确率较差、不具有针对性的缺点,本发明提供一种基于主成分分析的多元水文时间序列匹配模型构建方法。

技术方案:为实现上述发明目的,本发明使用第三方软件R作为程序编制和模型仿真预测的工具,分为三个部分,分别是数据预处理、模式表示和相似性匹配。由于水文时间序列大多来源于传感器的记录,通常具有很高的维度和很长的序列,并且包含大量噪音,因此需要对其进行预处理,降低对相似性匹配的干扰。模式表示包括对数据进行PAA和PCA处理,实现时间序列在时间维度和变量维度上的降维。相似性匹配采用加权的DTW作为距离度量的方法。

与现有一些技术相比,本发明的有益效果是在多元水文时间序列的相似性匹配问题中,提高了多元水文时间序列匹配的效率和准确性。

一种基于主成分分析的多元水文时间序列匹配模型构建方法,主要实现步骤如下:

步骤1:对水文时间序列数据进行标准化处理,统一数据单位;可以根据实际需求选择合适的标准化方法,目的是为了消除由于单位不同可能带来的影响;

步骤2:对标准化后的时间序列应用分段聚合近似(PAA)方法,,得到多元时间序列的矩阵表示Xn×m(m表示变量个数,n表示时间长度),在应用PAA方法时,根据实际情况选择合适的分段长度,对于时间序列数据挖掘,只需关注序列的整体形态和趋势。如果只需要表示时间序列的大致形态,可以选择较长的分段长度,来获得较高的数据压缩率,提高挖掘效率。如果要保留较多时间序列的细节,则应该选择较短分段长度。

步骤3:对经过步骤2处理后的时间序列Xn×m进行主成分分析,首先需要计算数据集中变量之间的协方差,得到一个协方差矩阵Sm×m(m表示多元时间序列中变量个数),再通过奇异值分解对协方差矩阵进行特征值和特征向量分解,选择累计方差贡献率达到预设值的前k个特征值按大小排序,并将其对应的特征向量组合成特征向量矩阵Um×k

步骤4:把步骤2得到的数据Xn×m映射到特征向量矩阵上Yn×k=Xn×mUm×k,实现降维处理,同时把特征向量的方差贡献率作为权重w。

步骤5:使用步骤4得到的方差贡献率作为权重w,将给定的时间序列与步骤4映射后的数据Yn×k使用加权的DTW方法进行相似性匹配。即:

其中X[i:-]表示由矩阵X的第i个列向量到最后一个列向量组成的子序列。

Dbase(ai,bj)表示向量ai和bj之间的基距离,计算方式为:

wi、wj是向量ai、bj对应的特征向量的贡献率,这里作为权重。

步骤6:通过计算在数据集中匹配出与给定时间序列最为相似即距离最小的一个或者多个时间序列。

优选地,所述步骤2中,采用PAA方法,将长度为s的时间序列平均分成v段,每段序列具有相同的长度l,并且利用每段序列的均值来近似表示该序列段,是一个压缩比例为l=s/v的数据降维过程,由于多元水文时间序列各变量之间存在相关性,因此对全部相关变量同时进行分段操作,符合多元水文时间序列的特点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711210985.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top