[发明专利]一种自动生成样本的多牌号化工过程软测量建模方法有效
| 申请号: | 201810692852.X | 申请日: | 2018-06-29 |
| 公开(公告)号: | CN109002686B | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 刘毅;陈波成;徐东伟;陈壮志;宣琦 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C20/10;G06N3/08;G06N3/04 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自动 生成 样本 牌号 化工 过程 测量 建模 方法 | ||
1.一种自动生成样本的多牌号化工过程软测量建模方法,其特征在于,所述方法包括以下步骤:
(1)划分多牌号化工过程数据集
将从多牌号化工过程中采集到的数据作为原始数据,按设定比例划分为训练集和测试集,以便于交叉验证;
(2)AGAN模型原理及训练过程
建立基于梯度惩罚和Wasserstein距离的生成对抗网络AGAN,将所划分的训练集输入所建立的生成对抗网络,对网络进行训练;
(3)构建新训练集
利用训练好的AGAN生成虚拟样本,与原有的训练集共同形成新的训练集;
(4)根据新的训练集调节软测量模型参数
利用新的训练集作为驱动数据,进行软测量建模的训练,调节软测量模型参数以适应新的训练集,利用训练好的软测量模型进行多牌号化工过程关键质量变量的预测;
所述步骤(2)的过程如下:
步骤2.1:建立基于梯度惩罚和Wasserstein距离的生成对抗网络;
Wasserstein距离是用于衡量两分布之间的距离,计算公式如下:
其中:Pr为真实数据的分布;Pg为生成数据的分布;Π(Pr,Pg)为Pr和Pg组合起来的所有可能的联合分布的集合;(x,y)~γ表示为从γ中采样得到一个真实数据x和一个生成数据y;||x-y||为真实数据与生成数据之间的距离;为期望;inf表示取下界;整个W函数表示为在所有的联合分布中对期望值取到的下界,将此期望值定义为Wasserstein距离;
将上述计算公式转换为如下公式:
其中:x服从Pr的分布;服从Pg的分布;f(x)为包含x的函数,为包含的函数;K为函数f的Lipschitz常数,表示为在一个连续函数f上加一个限制,使得存在一个常数K≥0让定义域内的任意x1和x2都满足|f(x1)-f(x2)|≤K|x1-x2|;||f||L≤K表示函数f的Lipschitz常数不超过K;sup表示取上界;整个W函数表示在函数f的Lipschitz常数不超过K的情况下,1/K倍的的上界;
其中:fw(x)为包含x的函数;为包含的函数;fw为带参数w的一系列函数,此函数将由生成对抗网络中的网络构造;
根据Wasserstein距离的理论推导,生成对抗网络中,判别器D和生成器G的损失函数如下:
其中:S(D)为判别器损失函数;S(G)为生成器损失函数;Pr为真实数据的分布;Pg为生成数据的分布;x服从Pr的分布;服从Pg的分布;D(x)为包含x的函数;为包含的函数;
改进后的判别器的损失函数如下:
其中:为在和x的连线上随机插值采样的值;为的分布;ε为[0,1]之间的随机数;λ是梯度惩罚的系数;为函数的梯度的2范数;第一个部分为是生成器生成数据判别为真实数据的概率的期望,第二个部分为真实数据判别为真实数据的概率的期望,第三部分为梯度惩罚;
步骤2.2:基于梯度惩罚和Wasserstein距离的生成对抗网络的网络结构
AGAN由生成器和判别器两部分组成,分别为生成器和判别器;生成器由多层感知机构成,输入为符合标准高斯分布噪声,感知机的层数需要根据应用对象决定,第一层为输入层,中间层为隐藏层,最后一层为输出层,输出层的维度输入层维度相同,输入层和隐藏层的激活函数为修正线性单元ReLU;判别器由多层感知机构成,输入为原始训练数据或者生成数据,感知机的层数需要根据具体应用对象决定,第一层为输入层,中间层为隐藏层,最后一层为输出层,输入层和隐藏层的激活函数为修正线性单元;
步骤2.3:基于梯度惩罚和Wasserstein距离的生成对抗网络的训练过程如下
生成器用于捕捉样本数据分布,判别器用于估计一个样本数据来自真实数据而非生成数据的概率;生成器的输入为一组高斯分布的噪声,为生成器提供预先的数据分布,生成器能够将此数据分布转化为一组虚拟数据,即生成数据;判别器的输入为真实数据和生成数据,判别器的输出为输入样本是真实数据的概率;根据生成器损失函数,最大化判别器的输出概率能让生成器的损失下降,即生成器的能力提高,使得虚拟数据越接近真实数据的分布;根据判别器损失函数,最小化判别器的输出概率能让判别器的能力提高,使得判别器分辨真实数据与虚拟数据准确率越高;这就是生成对抗网络中,判别器和生成器的对抗性,当判别器和生成器达到平衡时,此时训练过程结束;
步骤2.4:基于梯度惩罚和Wasserstein距离的生成对抗网络参数更新,过程如下:
初始化相关参数:梯度惩罚系数:λ=10;w为判别器参数;θ为生成器参数;每次训练生成器,训练判别器的次数,ncritic=5;自适应矩估计的参数:α=0.0001,β1=0,β2=0.9;m为采样的个数;
2.4.1)x从真实数据分布Pr中采样,z服从隐空间P(z),隐空间由上述高斯分布的噪声定义,ε为[0-1]之间的随机数;
2.4.2)判别器损失的计算公式如下:
其中:Gθ(z)为包含z的函数,将z通过生成器进行数据的生成;S(D)(i)为第i个数据在判别器中计算的损失;为包含的函数;Dw(x)为包含x的函数;为函数的梯度的2范数;
2.4.3)根据自适应矩估计算法Adam,优化判别器的参数,梯度计算公式如下:
其中:为的梯度,采用批梯度下降法,每次使用m个样本更新w参数;
2.4.4)重复步骤1-4ncritic次;
2.4.5)从P(z)中采样m个样本根据Adam梯度下降法,优化生成器的参数,梯度计算公式如下:
其中:为的梯度,采用批梯度下降法,每次使用m个样本更新θ参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810692852.X/1.html,转载请声明来源钻瓜专利网。





