[发明专利]基于加权基分类器的stacking集成污水处理故障诊断方法有效

申请号：	201910566728.3	申请日：	2019-06-27
公开（公告）号：	CN110363230B	公开（公告）日：	2021-07-20
发明（设计）人：	许玉格;莫华森;罗飞;邓晓燕	申请（专利权）人：	华南理工大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G06N3/08;G06Q50/06;G06Q50/26
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	冯炳辉
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于加权分类 stacking 集成污水处理故障诊断方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于加权基分类器的stacking集成污水处理故障诊断方法，用均值法补全污水数据中属性不完整的样本的缺陷项，将其归一化到[0,1]区间中；设置基分类器隐层节点数、正则化系数、核宽度的最优参数；利用处理好的训练样本对基分类器进行3折交叉验证，获得基分类器的原始输出，并得到每个基分类器对于训练样本集的G‑mean值；根据基分类器G‑mean值，定义权值计算公式，得到每个基分类器的输出权值；将基分类器的原始输出转化为概率型输出，结合其输出权值，构造出元训练集；利用元训练集对元分类器进行训练，得到最终的诊断模型。本发明可以提高污水处理过程中故障诊断的整体性能。

技术领域

本发明涉及污水处理故障诊断的技术领域，尤其是指一种基于加权基分类器的stacking集成污水处理故障诊断方法。

背景技术

污水处理是一个复杂的，多变量的生化过程。污水处理厂发生故障容易引发一系列严重的污水污染问题。而污水处理过程的故障诊断可转化为一个模式识别的分类问题。污水数据由定期将污水厂采集到的数据及其当前工作状态组成，一段时间内的污水数据组成污水数据集。由于合格的污水处理厂发生故障的频率很低，采集到的污水数据集中故障状态下的数据往往远少于正常状态下的数据。这就导致污水数据集是分布高度不平衡集，即污水处理过程的故障诊断是一个数据不平衡的分类问题。

传统学习算法往往基于总体准确率对参数进行优化，这容易使分类结果更偏向多数类。但在现实应用场合更被看重的是少数类的分类准确率，即在污水处理故障诊断场合，更重要的是准确分类出作为少数类的故障类。准确分类出作为少数类的故障类对及时诊断污水处理厂的运行故障并及时进行处理有巨大的帮助。及时诊断并处理污水故障可稳定出水水质并减少污水对环境的污染，并减少维护费用。因此，应注重研究及时精确少数类的故障类的故障诊断算法。

发明内容

本发明的目的是为了解决现有学习算法里对污水故障识别效果不佳的缺陷，提出了一种基于加权基分类器的stacking集成污水处理故障诊断方法，通过构造一个两层的叠加式框架结构，选择3种对不平衡数据有不错分类效果的分类算法，即SVM，RVM，WELM作为基分类器，得到基分类器的权值，并对基分类器的输出结果进行加权融合，并选择WELM作为最终输出诊断结果的分类器。实验证明，本方法提高了对污水处理故障类的分类准确率，进而有效提高了污水处理过程中故障诊断的整体性能。

为实现上述目的，本发明所提供的技术方案为：基于加权基分类器的stacking集成污水处理故障诊断方法，包括以下步骤：

1)原始污水数据中某些样本在某些属性上如化学需氧量COD，生化需氧量BOD等上存在缺失值，对这些样本采用均值法补全其缺失值，并将所有属性值归一化到[0,1]区间；

2)利用步骤1)中处理好的完整的污水样本作为Stacking两层学习框架中的第一层基分类器的原始输入，其中基分类器选择SVM，WELM，RVM(支持向量机，加权极限学习机，相关向量机)，分别对3个基分类器进行3折交叉验证，得到第一层学习对每个污水样本的诊断结果，即3个基分类器对于每个污水样本在4个类别上的输出值，并且得到3个基分类器对于训练样本的G-mean；其中，该4个类别分别是：正常状态、正常状态但某些性能指标超过平均值、正常状态但是进水流量低、故障类情况；

3)根据步骤2)中得到的G-mean值，定义基于G-mean值的基分类器输出权值计算公式，获得基分类器h_i(x)对应的输出权值α_i；

4)将步骤2)中的输出结果转化为概率型输出，即得到了每个原始污水样本分别属于4个类别的概率值，利用每个样本属于4个类别的概率值乘以步骤3)中获得的基分类器的权值α_i，加上原始的类别标签，构造成新的训练集，称为元训练集；

5)用步骤4)得到的元训练集作为Stacking两层学习框架中第二层元分类器的输入，其中选择WELM作为第二层的元分类器，得到最终的诊断模型M_stacking；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910566728.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于改进RReliefF和mRMR相结合的人体特征参数选择方法
下一篇：基于BP神经网络的毫米波探测器干扰效果评估方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于加权基分类器的stacking集成污水处理故障诊断方法有效

专利文献下载