[发明专利]一种自动生成样本的多牌号化工过程软测量建模方法有效

申请号：	201810692852.X	申请日：	2018-06-29
公开（公告）号：	CN109002686B	公开（公告）日：	2022-04-08
发明（设计）人：	刘毅;陈波成;徐东伟;陈壮志;宣琦	申请（专利权）人：	浙江工业大学
主分类号：	G16C20/70	分类号：	G16C20/70;G16C20/10;G06N3/08;G06N3/04
代理公司：	杭州斯可睿专利事务所有限公司 33241	代理人：	王利强
地址：	310014 浙江省***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种自动生成样本牌号化工过程测量建模方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种自动生成样本的多牌号化工过程软测量建模方法，其特征在于，所述方法包括以下步骤：

(1)划分多牌号化工过程数据集

将从多牌号化工过程中采集到的数据作为原始数据，按设定比例划分为训练集和测试集，以便于交叉验证；

(2)AGAN模型原理及训练过程

建立基于梯度惩罚和Wasserstein距离的生成对抗网络AGAN，将所划分的训练集输入所建立的生成对抗网络，对网络进行训练；

(3)构建新训练集

利用训练好的AGAN生成虚拟样本，与原有的训练集共同形成新的训练集；

(4)根据新的训练集调节软测量模型参数

利用新的训练集作为驱动数据，进行软测量建模的训练，调节软测量模型参数以适应新的训练集，利用训练好的软测量模型进行多牌号化工过程关键质量变量的预测；

所述步骤(2)的过程如下：

步骤2.1：建立基于梯度惩罚和Wasserstein距离的生成对抗网络；

Wasserstein距离是用于衡量两分布之间的距离，计算公式如下：

其中：P_r为真实数据的分布；P_g为生成数据的分布；Π(P_r,P_g)为P_r和P_g组合起来的所有可能的联合分布的集合；(x,y)～γ表示为从γ中采样得到一个真实数据x和一个生成数据y；||x-y||为真实数据与生成数据之间的距离；为期望；inf表示取下界；整个W函数表示为在所有的联合分布中对期望值取到的下界，将此期望值定义为Wasserstein距离；

将上述计算公式转换为如下公式：

其中：x服从P_r的分布；服从P_g的分布；f(x)为包含x的函数，为包含的函数；K为函数f的Lipschitz常数，表示为在一个连续函数f上加一个限制，使得存在一个常数K≥0让定义域内的任意x₁和x₂都满足|f(x₁)-f(x₂)|≤K|x₁-x₂|；||f||_L≤K表示函数f的Lipschitz常数不超过K；sup表示取上界；整个W函数表示在函数f的Lipschitz常数不超过K的情况下，1/K倍的的上界；

其中：f_w(x)为包含x的函数；为包含的函数；f_w为带参数w的一系列函数，此函数将由生成对抗网络中的网络构造；

根据Wasserstein距离的理论推导，生成对抗网络中，判别器D和生成器G的损失函数如下：

其中：S(D)为判别器损失函数；S(G)为生成器损失函数；P_r为真实数据的分布；P_g为生成数据的分布；x服从P_r的分布；服从P_g的分布；D(x)为包含x的函数；为包含的函数；

改进后的判别器的损失函数如下：

其中：为在和x的连线上随机插值采样的值；为的分布；ε为[0,1]之间的随机数；λ是梯度惩罚的系数；为函数的梯度的2范数；第一个部分为是生成器生成数据判别为真实数据的概率的期望，第二个部分为真实数据判别为真实数据的概率的期望，第三部分为梯度惩罚；

步骤2.2：基于梯度惩罚和Wasserstein距离的生成对抗网络的网络结构

AGAN由生成器和判别器两部分组成，分别为生成器和判别器；生成器由多层感知机构成，输入为符合标准高斯分布噪声，感知机的层数需要根据应用对象决定，第一层为输入层，中间层为隐藏层，最后一层为输出层，输出层的维度输入层维度相同，输入层和隐藏层的激活函数为修正线性单元ReLU；判别器由多层感知机构成，输入为原始训练数据或者生成数据，感知机的层数需要根据具体应用对象决定，第一层为输入层，中间层为隐藏层，最后一层为输出层，输入层和隐藏层的激活函数为修正线性单元；

步骤2.3：基于梯度惩罚和Wasserstein距离的生成对抗网络的训练过程如下

生成器用于捕捉样本数据分布，判别器用于估计一个样本数据来自真实数据而非生成数据的概率；生成器的输入为一组高斯分布的噪声，为生成器提供预先的数据分布，生成器能够将此数据分布转化为一组虚拟数据，即生成数据；判别器的输入为真实数据和生成数据，判别器的输出为输入样本是真实数据的概率；根据生成器损失函数，最大化判别器的输出概率能让生成器的损失下降，即生成器的能力提高，使得虚拟数据越接近真实数据的分布；根据判别器损失函数，最小化判别器的输出概率能让判别器的能力提高，使得判别器分辨真实数据与虚拟数据准确率越高；这就是生成对抗网络中，判别器和生成器的对抗性，当判别器和生成器达到平衡时，此时训练过程结束；

步骤2.4：基于梯度惩罚和Wasserstein距离的生成对抗网络参数更新，过程如下：

初始化相关参数：梯度惩罚系数：λ＝10；w为判别器参数；θ为生成器参数；每次训练生成器，训练判别器的次数，n_critic＝5；自适应矩估计的参数：α＝0.0001，β₁＝0，β₂＝0.9；m为采样的个数；

2.4.1)x从真实数据分布P_r中采样，z服从隐空间P(z)，隐空间由上述高斯分布的噪声定义，ε为[0-1]之间的随机数；

2.4.2)判别器损失的计算公式如下：

其中：G_θ(z)为包含z的函数，将z通过生成器进行数据的生成；S(D)⁽ⁱ⁾为第i个数据在判别器中计算的损失；为包含的函数；D_w(x)为包含x的函数；为函数的梯度的2范数；

2.4.3)根据自适应矩估计算法Adam，优化判别器的参数，梯度计算公式如下：

其中：为的梯度，采用批梯度下降法，每次使用m个样本更新w参数；

2.4.4)重复步骤1-4n_critic次；

2.4.5)从P(z)中采样m个样本根据Adam梯度下降法，优化生成器的参数，梯度计算公式如下：

其中：为的梯度，采用批梯度下降法，每次使用m个样本更新θ参数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载