[发明专利]一种火电机组煤耗预测、数据清洗方法及系统在审
申请号: | 202111073933.X | 申请日: | 2021-09-14 |
公开(公告)号: | CN113986892A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 管超;甘露平;周明琴;杨利利 | 申请(专利权)人: | 国电南京自动化股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06F16/28;G06Q10/04;G06Q50/06 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 邵斌 |
地址: | 210009 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 火电 机组 煤耗 预测 数据 清洗 方法 系统 | ||
1.一种火电机组煤耗预测数据清洗方法,其特征是,包括:
获取给定时间段的火电机组历史运行数据,建立初步样本数据库;
对初步样本数据库中的样本数据进行常规清洗,获得第一样本数据;
去除第一样本数据中与火电机组的运行规则不匹配的数据,获得第二样本数据;
利用给定的数据挖掘算法剔除第二样本数据中的异常数据,获得第三样本数据;
对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测。
2.根据权利要求1所述的火电机组煤耗预测数据清洗方法,其特征是,所述常规清洗包括去除空值、文本值和非法值,同时,对每一个维度,分别计算第一样本数据的基本特征值,并进行可视化。
3.根据权利要求1所述的火电机组煤耗预测数据清洗方法,其特征是,所述火电机组的运行规则包括火电机组的运行负荷。
4.根据权利要求1所述的火电机组煤耗预测数据清洗方法,其特征是,所述利用给定的数据挖掘算法剔除第二样本数据中的异常数据,包括:
利用主成分分析算法确定输入变量;
计算各输入变量的特征指标值、分布曲线并可视化;
利用局部异常因子算法或者DBSCAN聚类算法侦测并剔除孤立点、离群点;
利用箱线图检测、均方差检测进行稳态检测,最终形成第三样本数据。
5.根据权利要求4所述的火电机组煤耗预测数据清洗方法,其特征是,所述利用箱线图检测、均方差检测进行稳态检测,具体为:箱线图检测对单元数据计算上四分位数和下四分位数,去除两端的值,再在此基础上设置阈值ξ的情况下计算均方差校正因箱线图单元数据区间段选择不完善导致的漏掉的数据,其中,n表示[t-d,t]时间段内数据点数量;Pi表示时刻i对应的参数值;表示[t-d,t]时间段内的参数均值;ξ表示设定阈值。
6.根据权利要求1所述的火电机组煤耗预测数据清洗方法,其特征是,采用K-means聚类算法对第三样本数据进行工况划分。
7.一种火电机组煤耗预测数据清洗系统,其特征是,包括:
第一模块,用于获取给定时间段的火电机组历史运行数据,建立初步样本数据库;
第二模块,用于对初步样本数据库中的样本数据进行常规清洗,获得第一样本数据;
第三模块,用于去除第一样本数据中与火电机组的运行规则不匹配的数据,获得第二样本数据;
第四模块,用于利用给定的数据挖掘算法剔除第二样本数据中的异常数据,获得第三样本数据;
第五模块,用于对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测。
8.一种火电机组煤耗预测方法,其特征是,采用权利要求1~6任一项所述的火电机组煤耗预测数据清洗方法获取不同工况下的样本数据,用于火电机组煤耗预测;包括:
根据不同工况下的样本数据计算拟合优度、P值;
根据拟合优度和P值,调整给定的数据挖掘算法的参数及对第三样本数据进行工况划分时的参数,最终形成火电机组煤耗预测模型。
9.一种火电机组煤耗预测系统,其特征是,采用权利要求7所述的火电机组煤耗预测数据清洗系统获取不同工况下的样本数据,用于火电机组煤耗预测;包括:
第六模块,用于根据不同工况下的样本数据计算拟合优度、P值;
第七模块,用于根据拟合优度和P值,调整给定的数据挖掘算法的参数及对第三样本数据进行工况划分时的参数,最终形成火电机组煤耗预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国电南京自动化股份有限公司,未经国电南京自动化股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111073933.X/1.html,转载请声明来源钻瓜专利网。