[发明专利]一种基于自编码神经网络的城市污水处理过程异常数据检测方法在审
申请号: | 202211692992.X | 申请日: | 2022-12-28 |
公开(公告)号: | CN115879052A | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 韩红桂;孙美婷;李方昱 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F18/2433 | 分类号: | G06F18/2433;G06F18/214;G06N3/084;G06N3/045;G06N3/0895 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码 神经网络 城市 污水处理 过程 异常 数据 检测 方法 | ||
1.一种基于自编码神经网络的城市污水处理过程异常数据检测方法,其特征在于,包括以下步骤:
(1)采集城市污水处理过程数据
以城市污水处理过程为研究对象,选取进水流量、进水化学需氧量、进水总磷、出水总氮、出水总磷、进水氨氮、进水酸碱度、曝气池温度和生物需氧量9个变量;所有变量按公式(1)归一化:
其中,i=1,…,9,t=1,2,…,Z,Z为样本总数,L1(t)为t时刻进水流量,单位为升/立方米,L2(t)为t时刻进水化学需氧量,单位为毫克/升,L3(t)为t时刻进水总磷浓度,单位为毫克/
升,L4(t)为t时刻出水总氮浓度,单位为毫克/升,L5(t)为t时刻出水总磷浓度,单位为毫克/升,L6(t)为t时刻进水氨氮浓度,单位为毫克/升,L7(t)为t时刻进水酸碱度,L8(t)为t时刻曝气池温度,单位为摄氏度,L9(t)为t时刻生物需氧量,单位为毫克/升,Li,max为第i个变量的最大值,Li,min为第i个变量的最小值,x1(t)为t时刻归一化进水流量,x2(t)为t时刻归一化进水化学需氧量,x3(t)为t时刻归一化进水总磷浓度,x4(t)为t时刻归一化出水总氮浓度,x5(t)为t时刻归一化出水总磷浓度,x6(t)为t时刻归一化进水氨氮浓度,x7(t)为t时刻归一化进水酸碱度,x8(t)为t时刻归一化曝气池温度,x9(t)为t时刻归一化生物需氧量;
将归一化后的Z个样本分为两组,一组为包含N个样本的训练集X,另一组为包含M个样本的测试集X′,NM,M=Z-N,N且M为正整数;
(2)建立基于自编码神经网络的检测模型
检测模型以自编码神经网络为载体,该模型包含以下三层:
输入层:由9个神经元组成,输入变量为x1(t),x2(t),x3(t),x4(t),x5(t),x6(t),x7(t),x8(t),x9(t),每个神经元的输出为:
ui(t)=xi(t) (2)
其中,ui(t)是t时刻第i个输入层神经元的输出值;
隐含层:由5个神经元组成,每个神经元输出为:
其中,hj(t)为t时刻第j个隐含层神经元的输出值,Weij(t)为t时刻第i个输入层神经元第j个隐含层神经元的连接权重,bej(t)为t时刻第j个隐含层神经元的偏移量,j=1,…,5;
输出层:由9个神经元组成,每个神经元输出为:
其中,为t时刻第i个输出层神经元的输出值,Wdji(t)为t时刻第j个隐含层神经元第i个输出层神经元的连接权重,bdi(t)为t时刻第i个输出层神经元的偏移量;
(3)设计基于梯度下降的检测模型参数更新方法
①设初始迭代次数s=1,最大迭代次数S=150,初次迭代隐含层神经元连接权重W1eij(t)在区间[-1,1]中随机取值,初次迭代隐含层神经元偏移量在区间[-1,1]中随机取值,初次迭代输出层神经元连接权重W1dji(t)在区间[-1,1]中随机取值,初次迭代输出层神经元偏移量/在区间[-1,1]中随机取值;
②将训练集X=[x1(t),…,xn(t)]T输入检测模型,xn(t)=[x1n(t),…,xin(t)]为第n个训练样本,n=1,…,N,T为转置计算,根据公式(2)-(4),得到训练误差函数E(t)为:
其中,xin(t)为第n个训练样本中的第i个变量值,为检测模型输出中的第i个变量值;
③利用梯度下降算法更新检测模型参数:
其中,为第s次迭代第j个隐含层神经元连接权重,为第s次迭代隐含层神经元的偏移量,/为第s次迭代第i个输出层神经元连接权重,/为第s次迭代输出层神经元的偏移量,/
α为学习率且取值范围为(0,0.1);
④若sS,则s增加1,返回步骤②;若s≥S,则停止训练,得到训练好的检测模型;
(4)构建基于记忆模块的自适应异常分数阈值判别策略
Ⅰ设记忆模块初始指针为p=1,记忆长度q=20,初始测试样本数m=1;
Ⅱ将测试集X′=[x′1(t),…,x′m(t)]T顺序输入到训练好的检测模型中,第m个测试样本x′m(t)=[x′1m(t),…,x′im(t)]的异常分数为:
其中,x′im(t)为第m个测试样本中的第i个变量值,为检测模型输出中的第i个变量值;
将异常分数em(t)保存到记忆模块P;
Ⅲ若p≤m≤p+q,则m增加1,返回步骤Ⅱ;若mp+q,则执行步骤Ⅳ;
Ⅳ从记忆模块P中提取异常分数e(t)=[ep(t),…,em(t)],p≤m≤p+q,计算异常分数的上阈值εmax和下阈值εmin:
εmax=u+3σ (11)
εmin=u-3σ (12)
其中,u为测试样本异常分数的平均值,σ为测试样本异常分数的标准差,计算公式为;
Ⅴ根据公式(11)-(14),对测试样本x′m(t)标记异常标签Im(t):
其中,Im(t)=1表示测试样本x′m(t)为异常样本,Im(t)=0表示测试样本x′m(t)为正常样本,将Im(t)输入异常标签向量I(t)中;
Ⅵ若m≤M,则p增加1,m增加1,返回步骤Ⅱ;若mM,则停止检测;
(5)实现城市污水处理过程异常数据检测
输出M个测试样本异常标签向量I(t)=[I1(t),…,IM(t)],实现城市污水处理过程异常数据检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211692992.X/1.html,转载请声明来源钻瓜专利网。