[发明专利]基于加权基分类器的stacking集成污水处理故障诊断方法有效
| 申请号: | 201910566728.3 | 申请日: | 2019-06-27 |
| 公开(公告)号: | CN110363230B | 公开(公告)日: | 2021-07-20 |
| 发明(设计)人: | 许玉格;莫华森;罗飞;邓晓燕 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06Q50/06;G06Q50/26 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 加权 分类 stacking 集成 污水处理 故障诊断 方法 | ||
本发明公开了一种基于加权基分类器的stacking集成污水处理故障诊断方法,用均值法补全污水数据中属性不完整的样本的缺陷项,将其归一化到[0,1]区间中;设置基分类器隐层节点数、正则化系数、核宽度的最优参数;利用处理好的训练样本对基分类器进行3折交叉验证,获得基分类器的原始输出,并得到每个基分类器对于训练样本集的G‑mean值;根据基分类器G‑mean值,定义权值计算公式,得到每个基分类器的输出权值;将基分类器的原始输出转化为概率型输出,结合其输出权值,构造出元训练集;利用元训练集对元分类器进行训练,得到最终的诊断模型。本发明可以提高污水处理过程中故障诊断的整体性能。
技术领域
本发明涉及污水处理故障诊断的技术领域,尤其是指一种基于加权基分类器的stacking集成污水处理故障诊断方法。
背景技术
污水处理是一个复杂的,多变量的生化过程。污水处理厂发生故障容易引发一系列严重的污水污染问题。而污水处理过程的故障诊断可转化为一个模式识别的分类问题。污水数据由定期将污水厂采集到的数据及其当前工作状态组成,一段时间内的污水数据组成污水数据集。由于合格的污水处理厂发生故障的频率很低,采集到的污水数据集中故障状态下的数据往往远少于正常状态下的数据。这就导致污水数据集是分布高度不平衡集,即污水处理过程的故障诊断是一个数据不平衡的分类问题。
传统学习算法往往基于总体准确率对参数进行优化,这容易使分类结果更偏向多数类。但在现实应用场合更被看重的是少数类的分类准确率,即在污水处理故障诊断场合,更重要的是准确分类出作为少数类的故障类。准确分类出作为少数类的故障类对及时诊断污水处理厂的运行故障并及时进行处理有巨大的帮助。及时诊断并处理污水故障可稳定出水水质并减少污水对环境的污染,并减少维护费用。因此,应注重研究及时精确少数类的故障类的故障诊断算法。
发明内容
本发明的目的是为了解决现有学习算法里对污水故障识别效果不佳的缺陷,提出了一种基于加权基分类器的stacking集成污水处理故障诊断方法,通过构造一个两层的叠加式框架结构,选择3种对不平衡数据有不错分类效果的分类算法,即SVM,RVM,WELM作为基分类器,得到基分类器的权值,并对基分类器的输出结果进行加权融合,并选择WELM作为最终输出诊断结果的分类器。实验证明,本方法提高了对污水处理故障类的分类准确率,进而有效提高了污水处理过程中故障诊断的整体性能。
为实现上述目的,本发明所提供的技术方案为:基于加权基分类器的stacking集成污水处理故障诊断方法,包括以下步骤:
1)原始污水数据中某些样本在某些属性上如化学需氧量COD,生化需氧量BOD等上存在缺失值,对这些样本采用均值法补全其缺失值,并将所有属性值归一化到[0,1]区间;
2)利用步骤1)中处理好的完整的污水样本作为Stacking两层学习框架中的第一层基分类器的原始输入,其中基分类器选择SVM,WELM,RVM(支持向量机,加权极限学习机,相关向量机),分别对3个基分类器进行3折交叉验证,得到第一层学习对每个污水样本的诊断结果,即3个基分类器对于每个污水样本在4个类别上的输出值,并且得到3个基分类器对于训练样本的G-mean;其中,该4个类别分别是:正常状态、正常状态但某些性能指标超过平均值、正常状态但是进水流量低、故障类情况;
3)根据步骤2)中得到的G-mean值,定义基于G-mean值的基分类器输出权值计算公式,获得基分类器hi(x)对应的输出权值αi;
4)将步骤2)中的输出结果转化为概率型输出,即得到了每个原始污水样本分别属于4个类别的概率值,利用每个样本属于4个类别的概率值乘以步骤3)中获得的基分类器的权值αi,加上原始的类别标签,构造成新的训练集,称为元训练集;
5)用步骤4)得到的元训练集作为Stacking两层学习框架中第二层元分类器的输入,其中选择WELM作为第二层的元分类器,得到最终的诊断模型Mstacking;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910566728.3/2.html,转载请声明来源钻瓜专利网。





