[发明专利]基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法有效
| 申请号: | 201711268459.X | 申请日: | 2017-12-05 |
| 公开(公告)号: | CN108228716B | 公开(公告)日: | 2020-01-14 |
| 发明(设计)人: | 许玉格;赖春伶;罗飞 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06Q50/06 |
| 代理公司: | 44245 广州市华学知识产权代理有限公司 | 代理人: | 冯炳辉 |
| 地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基分类器 故障诊断 污水处理 极限学习机 加权 污水处理过程 分类准确率 集成分类器 训练样本集 隐层节点数 不平衡性 最优参数 污水 归一化 过采样 均值法 有效地 算法 样本 多样性 输出 改进 | ||
1.基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法,其特征在于,包括以下步骤:
1)用均值法补全污水数据中属性不完整的样本的缺陷值,并将其归一化到[0,1]区间;
2)为了增加过采样数据的多样性,提出新的SMOTE过采样方法,对初始训练数据进行SMOTE过采样处理,获得新的训练数据,用该采样步骤替代原始Bagging算法中有放回Booststrap步骤;然后采用加权极限学习机作为基分类器,建立第i个基分类器hi(x),hi(x)表示第i个基分类器;最后,定义新的基于不平衡分类性能指标G-mean值的基分类器输出权值计算公式,并计算该基分类器的输出权值αi;其包括以下步骤:
2.1)给定含N个污水样本集X={(x1,y1),(x2,y2),...,(xN,yN)},样本共有K个类别,其中xi表示X的第i个样本,yi为K维列向量,表示其对应的类别标签,若xi属第K类,则yi的第K个元素标为1,其余元素标为-1,第1类样本的类别标签写为{1,-1,...,-1};
2.2)将X中样本数小于N×0.2的类别视为少数类,对少数类每类分别采用改进的SMOTE方法进行过采样,过采样后用得到的新样本结合原始数据组成新的训练集Xnew,以Xnew来训练一个加权极限学习机hi(x);其中,改进的SMOTE过采样方法具体如下:
2.2.1)从X中得到第j类少数类样本,将所有第j类少数类样本组成子数据集XRj,nj为XRj所含的少数类样本数,对XRj的每个样本xri,计算其与XRj中其余所有样本的欧氏距离,设置m为(0,nj]范围内的随机数,得到关于xri含m个少数类样本的K最近邻(k-NearestNeighbor,KNN)子集Si;
2.2.2)根据该少数类样本数与训练集总样本数的比例确定过采样倍率aj,aj的求取公式为:
即aj取nj,10三个数的最小值;
2.2.3)对XRj的每个样本xri,在其对应的Si中随机采样一个近邻样本xrr,生成的新样本xnew的每个特征取值为在xrr与xri在该特征空间连线上随机的一点,即
xnew=xri+rand(0,1)×(xri-xrr)
2.2.4)重复步骤2.2.3)直至生成aj·nj个新样本为止,最后去除重复的生成样本;
2.2.5)重复步骤2.2.1)到2.2.4),直至对每一类少数类的样本集XRj都进行了SMOTE过采样步骤;
2.3)用Xnew所有样本作为验证集,求加权极限学习机在验证集中分类得到的G-mean值GMi,根据G-mean值建立输出权值更新公式,计算其作为基分类器的输出权值αi,输出权值αi的求取公式为:
αi=0.5×ln(1+GMi)
3)重复步骤2),直至训练出T个带有输出权值的基分类器,T是基分类器的个数,将T个并列的基分类器进行加权计算,建立集成分类器;
4)用网格法进行参数寻优,求得基分类器的隐层节点数L及最优正则化系数C的最优参数组合,以此组参数为基础,训练得到最优的集成分类器H(x);
5)用步骤1)相同的方法填补污水待测数据的缺失值,并将其归一化到[0,1]区间,将处理后的待测数据输入H(x),得到输出分类结果即为待测数据对应的故障诊断结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711268459.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显示图像的方法、终端及计算机可读存储介质
- 下一篇:页面的加载方法及装置





