[发明专利]基于规则辅助的高炉冶炼过程数据驱动建模方法有效
申请号: | 201710246244.1 | 申请日: | 2017-04-15 |
公开(公告)号: | CN107092743B | 公开(公告)日: | 2020-03-06 |
发明(设计)人: | 渐令;宋晓欣;高富豪;宋允全;梁锡军 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F111/10 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 张媛媛 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 规则 辅助 高炉 冶炼 过程 数据 驱动 建模 方法 | ||
本发明涉及一种基于规则辅助的高炉冶炼过程数据驱动建模方法,通过收集、整理专家知识得到IF…THEN…规则,根据IF…THEN…规则将采集的原始数据转化为规则数据,利用多核学习算法整合多个专家知识得到基于规则的规则预测模型,并建立数据驱动预测模型,通过Sigmoid函数将规则预测模型和数据驱动预测模型的输出决策值转换为后验概率,并对数据驱动预测模型和规则预测模型进行集成,获得规则辅助的数据驱动模型。由于将专家知识、模糊规则等异质信息与数据驱动模型进行集成,与现有技术相比,本发明建模方法可以显著提高数据驱动模型的预测精度和可解释性,从而提高高炉冶炼过程采集数据的利用率。
技术领域
本发明属于数据挖掘与机器学习技术领域,涉及数据挖掘与数据处理方法,具体地说,涉及一种基于规则辅助的高炉冶炼过程数据驱动建模方法。
背景技术
数据驱动建模方法是当前的一个研究热点,学者们提出了大量数据驱动模型。数据驱动模型的应用范围非常广泛,涉及回归分析、聚类分析、分类问题、密度估计等诸多领域。其中,非线性模型凭借其强大的非线性逼近能力通常表现出较高的预测精度。然而,当前的非线性数据驱动模型仍存在以下两个亟待解决的主要问题:(1)无法有效整合专家知识、模糊规则等异质信息,导致无法进一步提升模型的精度;(2)缺乏可解释性,导致非线性数据驱动模型在许多对模型透明度较高的应用领域内使用受限。
近年来学者们针对非线性数据驱动模型存在的上述问题,开展了一系列试探性研究并取得初步研究成果。Jan与Jacek提出了一种从神经网络中提取规则的方法,该方法抽取的规则通过模拟网络背后的逻辑关系改进神经网络模型的推广能力。将先验知识融入非线性数据驱动模型则是另外一条有效途径。Maclin等人通过向SVMs优化问题加入不等式约束的方式合并先验知识到SVMs模型。更进一步,为了将非线性知识融入到非线性数据驱动模型中,Mangasarian等人借助理论分析将非线性先验知识转化为线性不等式约束。然而,上述方法都是针对具体算法设计的,无法实现规则知识与一般数据驱动模型的融合,导致这些数据驱动模型的精度低,可解释性差。
发明内容
本发明的目的在于针对LS-SVMs等现有数据驱动模型无法有效整合专家知识、模糊规则等多源异质数据导致精度无法进一步提高、数据驱动模型可解释性差等上述不足,提供了一种基于规则辅助的高炉冶炼过程数据驱动建模方法,该方法通过实现专家知识、模糊规则等信息与数据驱动模型的高效集成,进而提高数据驱动模型的精度和可解释性。
根据本发明一实施例,提供了一种基于规则辅助的高炉冶炼过程数据驱动建模方法,含有以下步骤:
(一)采集2000m3高炉冶炼过程实际数据,高炉实际采集数据具有时序特征,故在数据处理过程中保持数据先后顺序不变;采用如下数据处理方法对采样数据进行预处理,其中表示原始采集数据,表示第j个特征的平均值,表示第j个采集变量的标准差,将采集数据转换为无量纲数据,消除数据的数量级差异,将上述预处理后的数据转换为规则数据,其具体步骤为:
(1)收集并整理专家知识,利用决策树算法生成IF...THEN...规则:
;
(2)定义第k个样本点xk的第ip个特征关于基本规则区间的隶属度为:
其中,
(3)定义合取算子∧及析取算子V计算and-型规则及or-型规则对样本点xk的规则支持度为:
;
(4)利用规则支持度产生规则数据,规则数据表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710246244.1/2.html,转载请声明来源钻瓜专利网。