[发明专利]一种基于稀疏自编码和极限学习机的水质软测量方法在审
申请号: | 202011249258.7 | 申请日: | 2020-11-10 |
公开(公告)号: | CN112485394A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 杨秦敏;曹伟伟 | 申请(专利权)人: | 浙江大学 |
主分类号: | G01N33/18 | 分类号: | G01N33/18;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 编码 极限 学习机 水质 测量方法 | ||
1.一种基于稀疏自编码和极限学习机的水质软测量方法,其特征在于,包括以下步骤:
(1)获取样本数据:从污水处理过程中获取N0组样本数据每组输入向量Xi表征若干种污水水质成分,对应的期望输出Ti表征出水水质中的氨氮离子浓度。
(2)采用抽样方式对样本数据进行压缩,具体为:在[1,10]之间随机选择整数初始值a,采用每隔10点采集一次,则得到一批次压缩十倍的数据反复进行抽样,每次重新设定初始值a,得到p批次样本数据。
(3)样本数据归一化:针对每一批次样本数据分别进行去量纲化,将不同量纲的数据归一化至[-1,1]之间,得到归一化后的样本数据x。
(4)根据稀疏自编码器对数据进行降维,具体为:
从输入层到隐层有:
h=f(W1x+b1)
从隐层到输出层有:
其中h为隐层的输出,为输出层的输出,即重构矢量,f(·)为非线性映射,W与b为神经网络权重及偏置参数。
解码函数为线性函数或Sigmoid函数,使得重构误差最小,重构误差为:
在编码器中加入稀疏限制,控制隐层神经元激活数量,假设aj(x)表示隐层第j个神经元的激活函数,那么第j个神经元的平均激活量可表示为:
为了让大多数隐层神经元为非激活状态,让等于一个接近于0的常数ρ,ρ称为稀疏常数。选择KL散度作为惩罚项PN的表达式:
其中M为隐层的神经元个数,为KL散度。KL散度表达式为:
对于自编码器,代价函数为:
其中λ为权值衰减常数,nl为神经网络层数,sl为第l层神经元个数,为第l层神经网络的第ji个权重值。则包含稀疏惩罚项的总代价函数为:
Jsparse(W,b)=J(W,b)+βPN
其中β为稀疏惩罚项系数。
更新权重W和偏置b,则可以求得更新方程为:
其中为第l层神经网络的第i个偏置值,α为学习率,求得最优的W与b,可以获得更好的隐层输出h∈RN×M,用来表征检测样本数据的特征,从而实现对检测样本数据降维至M维;记Y=h。
(5)构建极限学习机,实现水质关键组分软测量,极限学习机神经网络由输入层、隐含层以及输出层共同构成,根据样本数据的特点,设定神经网络的输入层有M个节点,隐含层有L个节点,而输出层则有m个节点,具有步骤如下:
Step1:根据降维后的样本数据集的大小,确定输入数据的种类M及数据长度N。
其中G(·)为神经网络的激励函数,al,bl(l=1,2,...,L)分别为输入层到隐含层的权重和偏移值,L表示神经网络的隐含层节点个数,Y表征一共有N组神经网络输入数据,每组有M个特征值,即对应了神经网络输入层的节点个数,H为神经网络隐含层输出;
Step2:将污水出水水质作为目标历史数据T:
其中tj(j=1,2,....,N)为第j组目标历史数据的输出向量;
Step3:构建隐含层到输出层的网络,则有将此式写为矩阵形式则
T=βH
其中wlm为隐含层到输出层的权重向量,其矩阵则为β∈Rm×L,G(al,bl,Y)为隐含层输出,同时也为输出层输入,其矩阵形式则为H∈RL×N;
Step4:采用Moore-Penrose方法,得到隐含层到输出层的权重值:
其中IL为L维的单位矩阵,C为正常数值。
(6)完成一个批次样本数据的计算,再针对下一个批次样本数据进行计算,直到p批次样本数据完成计算;最终利用p批次样本数据的训练结果分别进行软测量,并将软测量的结果求平均,从而得到最终的软测量结果,即出水水质中的氨氮离子浓度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011249258.7/1.html,转载请声明来源钻瓜专利网。