[发明专利]一种基于xgboost模型的工业过程软测量方法在审
| 申请号: | 201810235181.4 | 申请日: | 2018-03-21 |
| 公开(公告)号: | CN108647373A | 公开(公告)日: | 2018-10-12 |
| 发明(设计)人: | 葛志强;宋博 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06F17/50 | 分类号: | G06F17/50;G06K9/62;G06F17/30 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 软测量 工业过程 预处理 复杂生产过程 最佳模型参数 非线性模型 软测量模型 训练样本集 变量关系 交叉验证 历史数据 目标变量 训练样本 验证数据 重复采样 快速性 拟合 | ||
本发明公开了一种基于xgboost模型的工业过程软测量方法,该方法首先对历史数据进行独立重复采样,预处理后分别得到训练样本集和验证数据集,利用训练样本建立xgboost模型,然后通过交叉验证选择最佳模型参数,确定针对目标变量的软测量模型。相比其他非线性模型,xgboost模型可以大大提高软测量的准确性和快速性,能够更好地拟合复杂生产过程中的变量关系。
技术领域
本发明属于工业过程控制领域,具体涉及一种基于xgboost模型的工业过程软测量方法。
背景技术
近年来,随着信息技术迅速发展,工业过程如冶金、化工生产等行业不断呈现更高程度自动化控制的趋势。软测量技术起源于70年代,为了解决生产过程中某些重要且关键的过程变量不容易测量,或因对应传感器价格昂贵,安装保养复杂等问题而发展起来。软测量技术把计算机科学技术融于自动化控制理论和实际生产过程中,通过选择其他一些易于测量的变量(也称之辅助变量),并基于这些易于测量的变量构成与难于测量或暂时没有条件测量的主导变量之间的某种数据关系构造一种关系模型,最终通过关系模型的推导处理而得到待测的主导变量。
传统的软测量方法在解决复杂过程的建模问题时,模型的泛化能力有限。模型的精确性和鲁棒性很难同时保证。近年来,研究人员尝试采用深度学习模型拟合复杂过程。但是,相较于图像、语音等高维数据,对于工业过程采集到的结构化数据,深度学习对于其中复杂关系的拟合效果并不好,并且生成模型的可解释性低。基于树模型的XGBoost则能很好地处理结构化数据,最重要的是拥有一些深度神经网络所没有的特性:模型可解释性好、输入数据不变性强、和更易于调参。而这些优点很好地满足了工业大数据建模所需要具备的特性:随着DCS等的广泛应用,工业生产中的传感器采集到的数据正呈现指数增长,利用xgboost从这些结构化,海量的数据中获取有效的信息,用于软测量能够快速得到准确,鲁棒并且可解释性强的模型。
发明内容
本发明的目的在于解决复杂生产过程中,目标变量不容易直接测量的问题。目标变量多对后续流程操作和产品质量影响很大,传统的非线性软测量模型在解决复杂变量关系时表现不够理想,通常无法快速得到准确,鲁棒并且可解释性强模型。
本发明的目的是通过以下技术方案来实现的:
一种基于xgboost模型的工业过程软测量方法,其特征在于,包括以下步骤:
(1)收集过程正常运行时的历史数据组成建模用的样本集:X=[x1,x2...xn],其中X∈Rn×m,n为样本总数,m为过程变量数,R为实数集。将这些数据存入历史数据库;
(2)采用独立重复采样方法对历史数据进行重排处理和预处理,分别得到训练数据矩阵测试数据矩阵
(3)调用xgboost数据格式转换函数DMatrix,将训练数据集和测试数据集分别转换成DMatrix格式;
(4)设置交叉验证参数,迭代器类型为gbtree,损失函数类型为linear,调用xgboost模型中的训练和参数寻优函数xgboost.train,确定最大树深度和迭代次数,其余参数采用默认值;
(5)确定函数寻优后的最佳模型参数,获得优化后的xgboost模型,然后将过程变量中易于测量的相关变量输入参数优化后的xgboost模型中,得到要预测的目标变量的值。
优选地,所述的步骤(3)具体为:调用xgboost.DMatrix函数,使用该函数将训练数据集和测试数据集由csv格式转换为xgboost自定义的Dmatrix数据格式,提高建模效率。
优选地,所述步骤(4)具体为:根据数据集的大小和实际要求,采用交叉验证,结合xgboost内置的训练和参数寻优函数xgboost.train,确定最佳模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810235181.4/2.html,转载请声明来源钻瓜专利网。





