[发明专利]一种基于多模型融合Stacking算法的煤质熔点预测方法有效

专利信息
申请号: 202111298890.5 申请日: 2021-11-04
公开(公告)号: CN113743540B 公开(公告)日: 2022-02-18
发明(设计)人: 李思琪;许冬亮;贾东升;王广永;祁海鹏;艾云涛 申请(专利权)人: 华能(天津)煤气化发电有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06Q10/04
代理公司: 北京华专卓海知识产权代理事务所(普通合伙) 11664 代理人: 王文峰
地址: 300450 *** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 模型 融合 stacking 算法 煤质 熔点 预测 方法
【权利要求书】:

1.一种基于多模型融合Stacking算法的煤质熔点预测方法,其特征在于,包括如下步骤:

步骤一:使用机器算法预测数据,首先确定煤质流动温度FT是目标变量;确定煤质中氧化物含量及新构造的特征参数是特征变量,所述特征变量为V0至V12共13个,分别对应为Na2O、MgO、Al2O3、SiO2、K2O、CaO、P2O5、TiO2、Fe2O3、SO3、K2O+Na2O、SiO2/Al2O3及煤质黏结指数Rhj;所述K2O+Na2O是K2O含量与Na2O含量之和,所述SiO2/Al2O3是SiO2含量除以Al2O3含量;所述煤质黏结指数Rhj的计算公式为:Rhj=Na2O*(Fe2O3+CaO+MgO+K2O+Na2O)/(SiO2+Al2O3+TiO2);

步骤二:将煤质灰熔点历史数据库命名为train数据库,其中含有13个所述特征变量和1个所述目标变量;将等待预测的数据库命名为test数据库,其中含有13个所述特征变量;

步骤三:根据特征变量分布情况将test数据库拆分成testA数据库及testB数据库,testA保留全部13个所述特征变量,testB删除超出范围的特征变量;构建其对应的trainA数据库及trainB数据库;具体办法如下:

对train数据库和test数据库的13个所述特征变量逐一进行数据分布探索,筛选出test数据库的特征变量均在train数据库范围内的数据集,命名为testA数据库,所述testA数据库仍为13个所述特征变量;如果test数据库内的数据集的某些特征变量超出train数据库范围,则将这部分数据集删除超出范围的特征变量组成testB数据库;减少数据分布偏差大的特征变量影响预测准确度,提高模型的泛化性;所述trainA数据库即为所述train数据库;所述trainB数据库中的特征变量对应所述testB数据库中的特征变量设置,由所述train数据库中的数据集剔除指定特征变量后的剩余数据集组成,所述指定特征变量为testB数据库中超出范围的特征变量;

步骤四:对trainA数据库的特征变量和目标变量进行最大最小归一化处理,对testA数据库的特征变量进行最大最小归一化处理;最大最小归一化公式为X’=(X-Xmin)/(Xmax-Xmin);

步骤五:对trainA数据库的特征变量和目标变量进行Box-Cox变换,对testA数据库的特征变量进行Box-Cox变换,改善数据的正态性、对称性和方差相等性;Box-Cox数学公式如下:

公式中y(λ)为经Box-Cox变换后得到的新变量,y为原始连续因变量,λ为变换参数;

步骤六:对trainA数据库的特征变量和目标变量进行异常值处理,对testA数据库的特征变量进行异常值处理;将数据进行正态化处理,此处采用“3σ准则”剔除异常值;

步骤七:选择以线性回归、随机森林及SVM模型作为基模型,以线性回归作为元模型;首先将训练得到前三个基模型,然后再以基模型的输出作为线性回归的输入训练元模型,最后以线性回归的输出作为真正的分类结果;

步骤八:数据经过预处理后,使用trainA数据库训练融合Stacking模型;选用随机森林、AdaBoost模型、GBoost回归模型、ExtraTrees 模型、Linear回归、XGBoost回归模型、lgb回归模型作为基模型,选用Linear回归模型、lgb 回归模型作为元模型;基模型分别进行单独训练,训练方法如下:

交叉验证(Cross Validation)方法使用K折交叉验证,各模型调参使用网格搜索(GridSearch)法;单独训练后进行融合,用Linear回归模型和lgb 回归模型对新的特征进行拟合训练,得到最终模型A;对trainB及testB重复步骤四到步骤八,得到模型B;

步骤九:使用步骤八训练的模型A预测testA数据库的灰熔点,同样使用模型B预测testB数据库的灰熔点。

2.根据权利要求1所述的基于多模型融合Stacking算法的煤质熔点预测方法,其特征在于,所述λ最初为未知数,为了使变换后样本y(λ)正态性最好,通过计算机程序计算比较不同的λ下y(λ),找出最优的λ值;有了λ值,将原变量数据y通过Box-Cox数学公式转换成新的y(λ);V0原skew为2.9017,V0转换skew为-0.2724,转换后的V0更加符合正态分布。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华能(天津)煤气化发电有限公司,未经华能(天津)煤气化发电有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111298890.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top