[发明专利]一种燃煤机组排放监测时序数据异常值检测方法在审
申请号: | 201611202669.4 | 申请日: | 2016-12-22 |
公开(公告)号: | CN106599271A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 孙栓柱;祁建民;周春蕾;张友卫;代家元;杨晨琛;李春岩;王林;王明;周志兴;佘国金;许国强;张袁丰 | 申请(专利权)人: | 江苏方天电力技术有限公司;国网江苏省电力公司;国家电网公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06Q50/26 |
代理公司: | 南京钟山专利代理有限公司32252 | 代理人: | 戴朝荣 |
地址: | 211100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 燃煤 机组 排放 监测 时序 数据 异常 检测 方法 | ||
技术领域
本发明属于能源领域,具体涉及一种燃煤机组排放监测时序数据异常值检测方法。
背景技术
随着我国节能减排工作的不断深入开展,燃煤机组污染物排放标准要求越来越严苛。2014年,国家发改委、环保部等部门联合制定了《煤电节能减排升级与改造行动计划(2014-2020年)》,提出了燃煤机组达到燃气轮机组污染物排放标准的要求,即所谓的超低排放,要求在基准氧含量6%条件下,烟尘、二氧化硫、氮氧化物排放浓度分别不高于10、35、50mg/Nm3。
为了响应国家政策的号召,江苏省燃煤机组于2014年开始大力开展超低排放改造,江苏方天电力技术有限公司在政府部门和有关政策的支持下,致力于开展超低排放系统数据在线监控和超低排放电价考核管理工作,将燃煤机组超低排放系统相关数据实施联网集成,其中包括负荷工况参数和烟囱排口SO2、NOx、烟尘浓度、氧量、温度、湿度、压力以及相关环保系统过程辅助参数。
随着超低排放改造工作的不断开展,燃煤机组污染物排放浓度数据的正常与否成为发电企业关注的焦点问题之一。燃煤机组超低排放监测数据随时间变化,是典型的时间序列数据。因此,超低排放时序数据中的异常值有2种类型:1、远离正常值分布范围的孤立点,即与历史分布不一致的异常点;2、由于时间序列数据变化的惯性,异常值会表现为不同于之前的变化趋势,即与当前趋势不一致的异常点。此外,超低排放监测数据以快至10秒、慢至1分钟的时间间隔进行采集,因此一个测点一年的数据记录条数约在52.6~315万之间。因此,超低排放时序数据异常值检测,就是要在这上百万条记录中发现数据正常分布的特征,建立高效的在线检测方法及时发现时序数据变化过程中的异常点,给出报警。
传统的监测数据异常值检测应用最多的是3西格玛法,它是根据测点在正常状态下的历史数据,分别计算出算术平均值μ和标准差σ,然后将正常值的范围设定在区间[μ-3σ,μ+3σ]内,超出这个范围的数据就是异常值。但是在燃煤机组超低排放异常值在线检测场景下,这种固定报警阈值的方法存在以下缺陷:
1)机组和超低排放设施的运行工况和运行方式是不断变化的,在不同的状态下测点会表现出不同的变化特征,进而导致不同状态下的测点数据的均值和方法表现出差异,使得基于全工况样本集得到的固定阈值不能很好地适应持续变化的运行工况;
2)由于固定阈值是在全工况样本集上得到的,为了适应所有工况其取值范围必然相对宽松,这就使得落在阈值范围内、但是其变化趋势异常的数据点无法被有效识别,导出出现漏检情况;
3)3西格玛法是基于数据呈正态分布这个假设的,而燃煤机组超低排放测点的监测数据即使在稳态工况下也不一定服从正态分布,因此3西格玛法不完全适用于燃煤机组超低排放应用。
发明内容
本发明的针对现有技术中的不足,提供一种燃煤机组排放监测时序数据异常值检测方法。
为实现上述目的,本发明采用以下技术方案:
一种燃煤机组排放监测时序数据异常值检测方法,其特征在于,包括以下步骤:
采用k-means聚类算法,对测点全工况历史样本数据集S进行工况划分,将相同工况的数据点归为一类;
针对每个工况样本集SC,基于统计假设检验方法,建立异常值检测模型;
根据工况样本集SC的数据特征选择不同的假设检验方法对测点时序数据进行辨识,定位与历史分布和当前变化趋势不一致的异常点。
为优化上述技术方案,采取的具体措施还包括:
所述工况划分包括:
随机选取全工况历史样本数据集S中的k个数据点作为初始聚类中心点;
对于全工况历史样本数据集S中每一个数据点,计算该数据点与各个初始聚类中心点之间的欧式距离,得到距离最近的初始聚类中心点,将这个初始聚类中心点的类作为该数据点的类;
对于每一个聚类,计算该聚类中所有数据点的均值,并将均值作为新聚类中心点;
计算每一个聚类中心点的变化,当最大变化值不超过预定的阈值,终止算法,得到k个聚类中心,表示k个不同的工况划分。
当工况样本集SC的样本数量>200时,使用KDE核密度估计方法,计算样本集SC数据分布的概率密度函数,得到95%置信区间,并根据新样本x是否落入95%置信区间来判断是否为异常点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏方天电力技术有限公司;国网江苏省电力公司;国家电网公司,未经江苏方天电力技术有限公司;国网江苏省电力公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611202669.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网络数据抓取方法和爬虫
- 下一篇:浏览器端图形对象的动态标绘方法、装置和系统