[发明专利]一种基于多模型融合Stacking算法的煤质熔点预测方法有效
申请号: | 202111298890.5 | 申请日: | 2021-11-04 |
公开(公告)号: | CN113743540B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 李思琪;许冬亮;贾东升;王广永;祁海鹏;艾云涛 | 申请(专利权)人: | 华能(天津)煤气化发电有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/04 |
代理公司: | 北京华专卓海知识产权代理事务所(普通合伙) 11664 | 代理人: | 王文峰 |
地址: | 300450 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 融合 stacking 算法 煤质 熔点 预测 方法 | ||
本发明公开了一种基于多模型融合Stacking算法的煤质熔点预测方法,使用机器算法预测数据,首先确定目标变量及特征变量,将test数据库拆分成testA数据库及testB数据库,构建其对应的trainA数据库及trainB数据库;对数据进行最大最小归一化处理、进行Box‑Cox变换、采用“3σ准则”剔除异常值等处理;选择基模型及元模型,基模型分别进行单独训练,元模型进行拟合训练,得到最终模型A,模型A预测testA数据库的灰熔点。本发明的煤质熔点预测方法,解决了耗时、耗能、耗力的弊端,能对大规模样品进行预测;模型的泛化性强,能够处理特征变量超出数据库的数据预测;模型拟合度高且避免模型过度拟合,预测的准确率高,预测数据方差较小,稳定性好。
技术领域
本发明涉及煤质灰熔点预测技术领域,尤其涉及一种基于多模型融合Stacking算法的煤质熔点预测方法。
背景技术
煤质的灰熔点是煤高温特性的重要测定项目之一,煤质熔融温度在工业上不论是火电厂还是煤气化炉中都具有非常重要的意义。传统煤质灰熔点是通过煤质高温实验测定,步骤较为繁琐,需逐步升温至1500度高温,耗时、耗能、耗力且每次测定的化验样品数有限,不适合大规模化验。
随着大数据、机器学习算法等计算机技术的发展,近几年采用算法拟合历史数据库的方法被应用在煤质的灰熔点预测中。但目前常见的灰熔点预测方法也存在一定问题。比如:
1、特征工程研究较少,选用的特征变量全而不精,影响预测准确率。
2、预测数据和历史数据库未做特征范围匹配,如果预测数据特征变量包含在历史数据库内,准确度较好,如果不包含在历史数据库内,准确度大大降低。
3、现有煤质灰熔点预测方法使用单一机器学习算法,拟合度和准确度仍有提高的空间。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种基于多模型融合Stacking算法的煤质熔点预测方法。
本发明提供的一种基于多模型融合Stacking算法的煤质熔点预测方法,包括如下步骤:
步骤一:使用机器算法预测数据,首先确定煤质流动温度FT是目标变量;确定煤质中氧化物含量及新构造的特征参数是特征变量,所述特征变量为V0至V12共13个,分别对应为Na2O、MgO、Al2O3、SiO2、K2O、CaO、P2O5、TiO2、Fe2O3、SO3、K2O+Na2O、SiO2/Al2O3及煤质黏结指数Rhj;
步骤二:将煤质灰熔点历史数据库命名为train数据库,其中含有13个所述特征变量和1个所述目标变量;将等待预测的数据库命名为test数据库,其中含有13个所述特征变量;
步骤三:根据特征变量分布情况将test数据库拆分成testA数据库及testB数据库,testA保留全部13个所述特征变量,testB删除超出范围的特征变量;构建其对应的trainA数据库及trainB数据库;具体办法如下:
对train数据库和test数据库的13个所述特征变量逐一进行数据分布探索,筛选出test数据库的特征变量均在train数据库范围内的数据集,命名为testA数据库,所述testA数据库仍为13个所述特征变量;如果test数据库内的数据集的某些特征变量超出train数据库范围,则将这部分数集删除超出范围的特征变量组成testB数据库;减少数据分布偏差大的特征变量影响预测准确度,提高模型的泛化性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华能(天津)煤气化发电有限公司,未经华能(天津)煤气化发电有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111298890.5/2.html,转载请声明来源钻瓜专利网。