[发明专利]基于stacking元学习策略的污水处理故障诊断方法有效
申请号: | 201910246706.9 | 申请日: | 2019-03-29 |
公开(公告)号: | CN110009030B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 许玉格;莫华森;罗飞;邓晓燕 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 stacking 学习 策略 污水处理 故障诊断 方法 | ||
1.基于stacking元学习策略的污水处理故障诊断方法,其特征在于,包括以下步骤:
1)原始污水数据有527个样本,每个样本有38维属性,其中部分样本在化学需氧量COD、生化需氧量BOD上存在缺失值,对这些样本采用均值法补全其缺失值,并将所有38维属性值归一化到[0,1]区间;
2)527个原始污水样本总共分为4类,第一类为正常状态类,第二类为正常状态但部分性能指标超过了平均值,第三类为正常状态但进水量低,第四类为故障类;利用步骤1)中处理好的527个完整的污水样本作为Stacking两层学习框架中的第一层基分类器的原始输入,其中,基分类器选择支持向量机SVM、加权极限学习机WELM和相关向量机RVM,分别对这3个基分类器进行3折交叉验证,得到第一层学习对每个污水样本的诊断结果,即3个基分类器对于每个污水样本在4个类别上的输出值;
3)将步骤2)中的输出结果转化为概率型输出,即得到了每个原始污水样本分别属于4个类别的概率值,利用每个样本属于4个不同类别的概率值加上原始的类别标签,构造成新的训练集,称为元训练集;
4)用步骤3)得到的元训练集作为Stacking两层学习框架中第二层元分类器的输入,其中选择WELM作为第二层的元分类器,得到最终的诊断模型Mstacking;
5)用步骤1)相同的方法填补污水待测数据的缺失值,并将其归一化到[0,1]区间,通过第一层基分类器在训练样本D上训练学习产生的模型Mk,K=1,2,3,分别对应3个基分类器,对处理后的待测数据输出预测结果;
6)对步骤5)中的预测结果用步骤3)相同的方法进行处理,在此基础上构成Mstacking的输入,其输出分类结果即为待测数据对应的故障诊断结果;
7)进行参数寻优,需要寻优的参数有WELM模型的隐层节点数L、最优正则化系数C及RVM模型的核宽度σ,寻优方法为网格法,以寻优得到的最优参数为基础,训练基分类器和元分类器。
2.根据权利要求1所述的基于stacking元学习策略的污水处理故障诊断方法,其特征在于,在步骤2)中,3折交叉验证的具体过程如下:
将训练数据集D随机分为3个大小相等的数据集D1,D2,D3;定义Dj和D-j=D-Dj,j=1,2,3,分别为3折交叉验证的第j折测试集和训练集;在训练集D-j上训练基分类器得到模型k=1,2,3,对于测试集Dj中的每一个样本,模型会输出一个预测结果;当交叉验证过程结束,则能够得到基分类器对于整个训练样本的输出结果。
3.根据权利要求1所述的基于stacking元学习策略的污水处理故障诊断方法,其特征在于,所述步骤3)的具体过程如下:
3.1)基分类器WELM的输出为数值输出,通过下述公式将数值输出转化为概率形式:
其中,x为某一样本,i为类别标签,m为类别个数,fi(x)为该样本属于标签i的原始输出,pi(x)为该样本属于标签i的概率型输出;通过此方法将基分类器WELM原输出结果A1为概率型输出结果A1';
3.2)SVM和RVM的基本模型是针对二分类问题的,其输出为硬判决输出,即对于一个样本的预测结果为0和1;基分类器SVM和RVM是利用一对一策略构建的多分类器,通过下述公式将硬判决输出转化为概率形式:
其中,x为某一样本,i为类别标签,m为类别个数,fi(x)为该样本属于标签i的原始输出,pi(x)为该样本属于标签i的概率型输出;通过此方法将基分类器SVM和RVM原输出结果A2,A3转化为概率型输出结果A2',A3';
3.3)将A1',A2',A3'和训练集标签拼接起来构造成新的训练集,即[A1'A2'A3'train_label],也称为元训练集,其中,train_label为原始训练样本类别标签。
4.根据权利要求1所述的基于stacking元学习策略的污水处理故障诊断方法,其特征在于,在步骤7)中,基分类器及元分类器的网格法寻优参数具体如下:
寻找隐层节点数L、最优正则化系数C及RVM模型的核宽度σ的参数组合以满足算法的最优性能,L的寻优范围为{10,15,20,…,500},步长为5;C的寻优范围为{20,21,…,218},步长为1;σ的寻优范围为{2-2.5,2-2.4,…,22.5},步长为0.1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910246706.9/1.html,转载请声明来源钻瓜专利网。