[发明专利]基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法有效

专利信息
申请号: 201711268459.X 申请日: 2017-12-05
公开(公告)号: CN108228716B 公开(公告)日: 2020-01-14
发明(设计)人: 许玉格;赖春伶;罗飞 申请(专利权)人: 华南理工大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/08;G06Q50/06
代理公司: 44245 广州市华学知识产权代理有限公司 代理人: 冯炳辉
地址: 511458 广东省广州市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基分类器 故障诊断 污水处理 极限学习机 加权 污水处理过程 分类准确率 集成分类器 训练样本集 隐层节点数 不平衡性 最优参数 污水 归一化 过采样 均值法 有效地 算法 样本 多样性 输出 改进
【权利要求书】:

1.基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法,其特征在于,包括以下步骤:

1)用均值法补全污水数据中属性不完整的样本的缺陷值,并将其归一化到[0,1]区间;

2)为了增加过采样数据的多样性,提出新的SMOTE过采样方法,对初始训练数据进行SMOTE过采样处理,获得新的训练数据,用该采样步骤替代原始Bagging算法中有放回Booststrap步骤;然后采用加权极限学习机作为基分类器,建立第i个基分类器hi(x),hi(x)表示第i个基分类器;最后,定义新的基于不平衡分类性能指标G-mean值的基分类器输出权值计算公式,并计算该基分类器的输出权值αi;其包括以下步骤:

2.1)给定含N个污水样本集X={(x1,y1),(x2,y2),...,(xN,yN)},样本共有K个类别,其中xi表示X的第i个样本,yi为K维列向量,表示其对应的类别标签,若xi属第K类,则yi的第K个元素标为1,其余元素标为-1,第1类样本的类别标签写为{1,-1,...,-1};

2.2)将X中样本数小于N×0.2的类别视为少数类,对少数类每类分别采用改进的SMOTE方法进行过采样,过采样后用得到的新样本结合原始数据组成新的训练集Xnew,以Xnew来训练一个加权极限学习机hi(x);其中,改进的SMOTE过采样方法具体如下:

2.2.1)从X中得到第j类少数类样本,将所有第j类少数类样本组成子数据集XRj,nj为XRj所含的少数类样本数,对XRj的每个样本xri,计算其与XRj中其余所有样本的欧氏距离,设置m为(0,nj]范围内的随机数,得到关于xri含m个少数类样本的K最近邻(k-NearestNeighbor,KNN)子集Si

2.2.2)根据该少数类样本数与训练集总样本数的比例确定过采样倍率aj,aj的求取公式为:

即aj取nj,10三个数的最小值;

2.2.3)对XRj的每个样本xri,在其对应的Si中随机采样一个近邻样本xrr,生成的新样本xnew的每个特征取值为在xrr与xri在该特征空间连线上随机的一点,即

xnew=xri+rand(0,1)×(xri-xrr)

2.2.4)重复步骤2.2.3)直至生成aj·nj个新样本为止,最后去除重复的生成样本;

2.2.5)重复步骤2.2.1)到2.2.4),直至对每一类少数类的样本集XRj都进行了SMOTE过采样步骤;

2.3)用Xnew所有样本作为验证集,求加权极限学习机在验证集中分类得到的G-mean值GMi,根据G-mean值建立输出权值更新公式,计算其作为基分类器的输出权值αi,输出权值αi的求取公式为:

αi=0.5×ln(1+GMi)

3)重复步骤2),直至训练出T个带有输出权值的基分类器,T是基分类器的个数,将T个并列的基分类器进行加权计算,建立集成分类器;

4)用网格法进行参数寻优,求得基分类器的隐层节点数L及最优正则化系数C的最优参数组合,以此组参数为基础,训练得到最优的集成分类器H(x);

5)用步骤1)相同的方法填补污水待测数据的缺失值,并将其归一化到[0,1]区间,将处理后的待测数据输入H(x),得到输出分类结果即为待测数据对应的故障诊断结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711268459.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top