[发明专利]一种自动生成样本的多牌号化工过程软测量建模方法有效

专利信息
申请号: 201810692852.X 申请日: 2018-06-29
公开(公告)号: CN109002686B 公开(公告)日: 2022-04-08
发明(设计)人: 刘毅;陈波成;徐东伟;陈壮志;宣琦 申请(专利权)人: 浙江工业大学
主分类号: G16C20/70 分类号: G16C20/70;G16C20/10;G06N3/08;G06N3/04
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自动 生成 样本 牌号 化工 过程 测量 建模 方法
【权利要求书】:

1.一种自动生成样本的多牌号化工过程软测量建模方法,其特征在于,所述方法包括以下步骤:

(1)划分多牌号化工过程数据集

将从多牌号化工过程中采集到的数据作为原始数据,按设定比例划分为训练集和测试集,以便于交叉验证;

(2)AGAN模型原理及训练过程

建立基于梯度惩罚和Wasserstein距离的生成对抗网络AGAN,将所划分的训练集输入所建立的生成对抗网络,对网络进行训练;

(3)构建新训练集

利用训练好的AGAN生成虚拟样本,与原有的训练集共同形成新的训练集;

(4)根据新的训练集调节软测量模型参数

利用新的训练集作为驱动数据,进行软测量建模的训练,调节软测量模型参数以适应新的训练集,利用训练好的软测量模型进行多牌号化工过程关键质量变量的预测;

所述步骤(2)的过程如下:

步骤2.1:建立基于梯度惩罚和Wasserstein距离的生成对抗网络;

Wasserstein距离是用于衡量两分布之间的距离,计算公式如下:

其中:Pr为真实数据的分布;Pg为生成数据的分布;Π(Pr,Pg)为Pr和Pg组合起来的所有可能的联合分布的集合;(x,y)~γ表示为从γ中采样得到一个真实数据x和一个生成数据y;||x-y||为真实数据与生成数据之间的距离;为期望;inf表示取下界;整个W函数表示为在所有的联合分布中对期望值取到的下界,将此期望值定义为Wasserstein距离;

将上述计算公式转换为如下公式:

其中:x服从Pr的分布;服从Pg的分布;f(x)为包含x的函数,为包含的函数;K为函数f的Lipschitz常数,表示为在一个连续函数f上加一个限制,使得存在一个常数K≥0让定义域内的任意x1和x2都满足|f(x1)-f(x2)|≤K|x1-x2|;||f||L≤K表示函数f的Lipschitz常数不超过K;sup表示取上界;整个W函数表示在函数f的Lipschitz常数不超过K的情况下,1/K倍的的上界;

其中:fw(x)为包含x的函数;为包含的函数;fw为带参数w的一系列函数,此函数将由生成对抗网络中的网络构造;

根据Wasserstein距离的理论推导,生成对抗网络中,判别器D和生成器G的损失函数如下:

其中:S(D)为判别器损失函数;S(G)为生成器损失函数;Pr为真实数据的分布;Pg为生成数据的分布;x服从Pr的分布;服从Pg的分布;D(x)为包含x的函数;为包含的函数;

改进后的判别器的损失函数如下:

其中:为在和x的连线上随机插值采样的值;为的分布;ε为[0,1]之间的随机数;λ是梯度惩罚的系数;为函数的梯度的2范数;第一个部分为是生成器生成数据判别为真实数据的概率的期望,第二个部分为真实数据判别为真实数据的概率的期望,第三部分为梯度惩罚;

步骤2.2:基于梯度惩罚和Wasserstein距离的生成对抗网络的网络结构

AGAN由生成器和判别器两部分组成,分别为生成器和判别器;生成器由多层感知机构成,输入为符合标准高斯分布噪声,感知机的层数需要根据应用对象决定,第一层为输入层,中间层为隐藏层,最后一层为输出层,输出层的维度输入层维度相同,输入层和隐藏层的激活函数为修正线性单元ReLU;判别器由多层感知机构成,输入为原始训练数据或者生成数据,感知机的层数需要根据具体应用对象决定,第一层为输入层,中间层为隐藏层,最后一层为输出层,输入层和隐藏层的激活函数为修正线性单元;

步骤2.3:基于梯度惩罚和Wasserstein距离的生成对抗网络的训练过程如下

生成器用于捕捉样本数据分布,判别器用于估计一个样本数据来自真实数据而非生成数据的概率;生成器的输入为一组高斯分布的噪声,为生成器提供预先的数据分布,生成器能够将此数据分布转化为一组虚拟数据,即生成数据;判别器的输入为真实数据和生成数据,判别器的输出为输入样本是真实数据的概率;根据生成器损失函数,最大化判别器的输出概率能让生成器的损失下降,即生成器的能力提高,使得虚拟数据越接近真实数据的分布;根据判别器损失函数,最小化判别器的输出概率能让判别器的能力提高,使得判别器分辨真实数据与虚拟数据准确率越高;这就是生成对抗网络中,判别器和生成器的对抗性,当判别器和生成器达到平衡时,此时训练过程结束;

步骤2.4:基于梯度惩罚和Wasserstein距离的生成对抗网络参数更新,过程如下:

初始化相关参数:梯度惩罚系数:λ=10;w为判别器参数;θ为生成器参数;每次训练生成器,训练判别器的次数,ncritic=5;自适应矩估计的参数:α=0.0001,β1=0,β2=0.9;m为采样的个数;

2.4.1)x从真实数据分布Pr中采样,z服从隐空间P(z),隐空间由上述高斯分布的噪声定义,ε为[0-1]之间的随机数;

2.4.2)判别器损失的计算公式如下:

其中:Gθ(z)为包含z的函数,将z通过生成器进行数据的生成;S(D)(i)为第i个数据在判别器中计算的损失;为包含的函数;Dw(x)为包含x的函数;为函数的梯度的2范数;

2.4.3)根据自适应矩估计算法Adam,优化判别器的参数,梯度计算公式如下:

其中:为的梯度,采用批梯度下降法,每次使用m个样本更新w参数;

2.4.4)重复步骤1-4ncritic次;

2.4.5)从P(z)中采样m个样本根据Adam梯度下降法,优化生成器的参数,梯度计算公式如下:

其中:为的梯度,采用批梯度下降法,每次使用m个样本更新θ参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810692852.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top