[发明专利]基于稀疏自编码的核极限学习机洪水预报方法在审
| 申请号: | 201710841563.7 | 申请日: | 2017-09-18 |
| 公开(公告)号: | CN107563567A | 公开(公告)日: | 2018-01-09 |
| 发明(设计)人: | 李士进;马凯凯;朱跃龙;冯钧;万定生;黄乐平 | 申请(专利权)人: | 河海大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/08 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙)32204 | 代理人: | 王安琪 |
| 地址: | 210098 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 稀疏 编码 极限 学习机 洪水 预报 方法 | ||
技术领域
本发明涉及水文预报技术领域,尤其是一种基于稀疏自编码的核极限学习机洪水预报方法。
背景技术
洪水预报工作是防灾减灾最重要的非工程措施,在历年的防汛抗旱、水资源管理与保护、水工程运行管理等工作中发挥了重要的作用,取得了显著的经济效益和社会效益。但洪水过程受流域自然地理、水文、气象、人类活动等诸多因素的影响,具有高度的复杂性和不确定性,因此准确地预报水雨情以便生成调度方案是一个急需要解决的难题。
深度学习近几年得到了广泛的研究,并应用到了各个领域,但是深度学习在水文预报中的应用较少,因此将其应用于水文预测中前景乐观。与常用的单隐层神经网络相比,深度学习更加强调了模型结构的深度,它具有更多的层数,通常有五层、六层甚至十几层的隐含层节点。深度学习通过学习一种深层非线性网络结构,实现更为复杂的函数逼近,能够更好的进行特征学习。
基于深层网络的特征学习能够更好地挖掘洪水数据中所蕴含的关系,对洪水预报起到更好的帮助。本发明将多层稀疏自编码的编码层融合到KELM中,提出了基于稀疏自编码的核极限学习机(SAE_KELM)的方法,也称为深层网络学习模型,它实现了无监督学习和有监督学习的有机融合,提高了非线性数据分类或预测效果,而且可以得到稳定的输出。对于洪水数据经过多层的特征学习能够更好地刻画数据内在的规律,通过实验也证明了本发明能有效提高洪水预报的准确率。
发明内容
本发明所要解决的技术问题在于,提供一种基于稀疏自编码的核极限学习机洪水预报方法,能够很好的处理了非线性数据的问题,预报效果得到明显提升。
为解决上述技术问题,本发明提供一种基于稀疏自编码的核极限学习机洪水预报方法,包括如下步骤:
(1)选取中小河流洪水数据,对数据进行整理与清洗;
(2)选取合适的预报因子并整理样本,对样本数据进行预处理;
(3)将原始样本数据经过多层稀疏自编码器进行无监督学习,分别训练最优网络层参数;
(4)经过多层稀疏自编码学习后的样本数据作为KELM模型的输入,构建SAE_KELM模型,预测并评价相应结果。
优选的,步骤(1)中,对数据进行整理与清洗具体包括如下步骤:
(11)选取流域历年夏季场次洪水数据作为研究对象,其中每隔1小时记录一个数据;
(12)数据元素包括流量和降雨量、其上游各测站降雨量;
(13)构建训练样本和测试样本;由于样本数据是有时间先后关系的,按顺序取,其中训练集取总样本的70%到90%之间,测试集取剩下的部分。
优选的,步骤(2)中,对样本数据进行预处理具体包括如下步骤:
(21)选择下游水文站的某一时刻的流量作为目标值,能够对下游水文站流量造成影响的因素包括上游的区间面降雨、上游支流的流量、土壤含水量和温度等。
(22)中小河流由于水文监测站的落后导致一些数据很难获取,因此没有选择土壤含水量和温度作为预报因子,选择待测水文站的前期流量和降雨量以及上游雨量站的降雨量作为预报因子,利用相关系数法计算上游降雨对下游流量影响的时间间隔,也就是上游前期多少时刻内的数据对下游当前时刻流量影响最大。计算公式如下:
其中,p为预报时刻的流量值,a为预报时刻前特征值。
优选的,步骤(3)中,将原始样本数据经过多层稀疏自编码器进行无监督学习具体包括如下步骤:
(31)对于输入样本集合xn为输入变量,d为特征维度,tn为目标值,N为样本个数,定义为给定输入x情况下节点j的激活值,得到公式:
其中为隐含节点j的平均激活值;
(32)神经网络后项传播损失函数为:
设定权值向量和偏置每个元素初始化为接近于0的随机数,通过前向传播得到每个神经元的激活值和输出;
(33)增加一个惩罚项公式来最优化目标函数:
采用相对熵衡量二者之间的差别,相对熵是描述两个概率分布差异的方法,KL散度公式为:当时,而且随着和ρ之间的差异增大而增大,使得逐渐接近ρ;
(34)稀疏自编码加入惩罚项后损失函数表示为:
其中β控制着稀疏惩罚项的权重大小,J(w,b)为均方差项;
(35)通过梯度下降和后项传播方法对稀疏自编码进行训练,隐含层误差项公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710841563.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





