[发明专利]一种城市污水处理过程出水指标在线软测量预测方法无效
申请号: | 201310503546.4 | 申请日: | 2013-10-23 |
公开(公告)号: | CN103632032A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | 刘乙奇;李艳;黄道平 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蔡茂略 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 发明公开了一种城市污水处理过程出水指标在线软测量预测方法,该方法首先采用以相关性为原则和递归偏最小二乘法为局部模型的即时学习模型结构,同时基于统计学习理论对模型自身不确定性进行描述,该模型可以充分反映污水处理过程不确定性、大滞后等特点,预测结果的解释性更强,控制人员可以及时调整曝气池的曝气量、回流量等工艺变量,维持物料平衡和细菌种群平衡,充分实现有机物的高效去除。 | ||
搜索关键词: | 一种 城市 污水处理 过程 出水 指标 在线 测量 预测 方法 | ||
【主权项】:
1.一种城市污水处理过程出水指标在线软测量预测方法,其特征在于,包括以下步骤:1)将从污水厂获取的数据中去除超过标准差3倍的数据,之后再将余下数据进行标准化处理:x i , m = x i - m s ]]>其中,xi,m是xi的转换形式,i=1,2,…,N,m和s分别是均值和标准差;2)将处理后的数据作为模型的训练集合,并把训练集合数据放在空间G中;3)现场测量获取一个新数据点后,开始建立局部模型:①根据新来数据点选择与之相关的数据首先引入Ci,j对其相关性进行衡量:x′i=xi-xqx′j=xj-xqC i , j = x j ′ x i ′ T | | x i ′ | | | | x j ′ | | > r ]]>其中,xi和xj是空间集合G中的数据,xq是新数据,随后选择相关系数Ci,j的数据并置于相关数据空间Z中,考察空间Z中的样本数是否大于数据的维数,如果大于则下一步,否则按r=r-δ放松相关限r的限制,使空间Z中的样本数大于数据的维数,按此逻辑,重新计算Ci,j,之后再进一步计算主元分析PCA指标,进而加深数据选择的相关性,如下情况:假设B=[X,Y]是n×m的数据矩阵,PCA将多变量的输入数据矩阵进行奇异值分解后得到主元和特征向量:B = TP T = t 1 p 1 T + t 2 p 2 T + . . . + t m p m T + ϵ ]]>其中,ti∈Rn被称为得分向量,即矩阵B的主元,pi∈Rm被称为负荷向量,ε是残差矩阵,它包含了系统的数据的主要噪声,T=[t1,t2,…,tn]和P=[p1,p2,…,,pm]分别是得分向量矩阵和负荷向量矩阵,当给定一个新的采样向量,PCA的得分向量、预测和残差向量的关系如下:t i = bp i , b ^ = bC , b ~ = b ( I - C ) ]]>其中,C=PTP,
是预测值,
是残差,采样向量被映射到了主元空间和残差空间,即,b = b ^ + b ~ ]]>统计量Q主要用于测量残差数据的变化Q = | | b ~ | | 2 = b ( I - C ) b T ]]>Q统计量是衡量原始数据和主元分析PCA处理后数据的差异性的指标,此外,为了避免模型外推误差,引入了T2统计量指标,T2统计量定义如下:T 2 = Σ i = 1 l t l 2 σ t l 2 ]]>其中,
表示第l个得分tl的标准差,l的确定是对
进行累加计算,直到
所对应的l值,T2统计量越小,则表示采样数据靠近模型数据的均值,Q统计量和T2统计量能作为综合指标来衡量数据的差异,J越小说明数据的相关性越强,否则相反,J=λT2+(1-λ)Q其中,T2和Q可由上述统计量计算公式算得,通常λ设置为0.9,确定最终数据选择指标J,并根据相应的J选择相对最相关的数据放于相应的数据库L中用于后续递归偏最小二乘算法的建模;②建立回归偏最小二乘模型根据相关数据集合,即数据库L,计算CPLS和相应的预测值:CPLS=(XTX)+XTY;ynew,=CPLSxq其中,X是数据库L中的与xq相关性最大的输入数据,Y是数据库L中的需要预测的历史值,而0+是右逆,CPLS是PLS算法的回归系数;③对于新来的数据点,除了利用数据库L来训练回归模型外,利用校验集合来计算每个输出值的p值,因此,每次只需计算新的数据点xq的可能分配到yq的
值,将
作为p值处理:p ( ( x 1 , y 1 ) , · · · , ( x d , y d ) , ( x q , y q ) ) = p ( y q ) = # { i = n + 1 , . . . , d , q : α i ≥ α q y q } d - n + 2 ]]>其中,#A代表了集合A中元素个数,若可以计算校验集合中每个可能输出的p值,所有输出的p值在置信度δ以内则其至少有δ概率发生故障,因此,给定置信度1-η,ICP算法的输出为:{yq:p(yq)>η},一致性测量指标是用来衡量真实输出值yi和预测值
而
可由
计算得出,相对于采样点xi的重要指标,定义为真实值和预测值的绝对误差:α i = | y i - y ^ i | ]]>以降序的方式排列计算所得αn+1,…,αd,在此基础上计算有上公式计算p(yq),再通过比例公式
推断得出
其中,σB和σp分别是空间G数据点标准偏差和对应获得输出新数据点的标准偏差,从而可确定其不确定区间为(-2σp,2σp);4)当新数据xq更新后,回到步骤3)计算新数据预测值ynew。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310503546.4/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用