[发明专利]一种基于变窗口模式识别的时间序列数据处理方法有效
| 申请号: | 202011402843.6 | 申请日: | 2020-12-02 |
| 公开(公告)号: | CN112632047B | 公开(公告)日: | 2023-08-01 |
| 发明(设计)人: | 翁存兴;曾凡春;田宏哲;刘先春;曹利蒲 | 申请(专利权)人: | 北京华能新锐控制技术有限公司 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06Q50/06 |
| 代理公司: | 北京中知法苑知识产权代理有限公司 11226 | 代理人: | 李明;赵吉阳 |
| 地址: | 102209 北京市昌平区北七家*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 窗口 模式识别 时间 序列 数据处理 方法 | ||
一种基于变窗口模式识别的时间序列缺失值填补方法,所述方法包括如下步骤:基于运行机理的风电机组有功功率相关性变量选取;基于数据特征选择的风电机组有功功率相关性变量选取;针对风电机组有功功率的多维相关性变量的变窗口模式匹配;基于相似模式的风电机组有功功率连续缺失数据块多重填补;多重填补结果评价及确认;针对工业物联网广泛存在以及常见的数据连续缺失情况,可以高效、准确的实现高比例缺失数据的填补,大大提高有效数据量,为机器学习、人工智能等数据驱动类算法的实施和应用奠定了重要的数据基础。
技术领域
本发明属于数据处理领域,特别是涉及一种基于变窗口模式识别的时间序列数据处理方法。
背景技术
随着物联网的出现,时间序列数据被传感器广泛采集和存储。然而,受断电、通讯或存储等因素影响,易引发数据连续缺失并形成缺失数据块,降低了数据质量,不仅影响实时监测性能,还危害到后续的离线数据分析与处理工作。
此外,受通讯干扰、传感器故障等因素影响,物联网所采集的时间序列中同样包含大量异常数据,在经历数据预处理环节后,大量异常数据被清洗,进一步加剧数据缺失程度。尤其是,连续缺失数据块的规模进一步增加,大大增加了缺失数据填补的难度。
当缺失数据占比较高时,用于缺失数据填补的有效信息急剧减少,如何实现高效、准确的完成缺失数据填补,并保证填补质量。
发明内容
为了克服以上现有生产中技术的不足,提供了一种基于变窗口模式识别的时间序列缺失值填补方法
一种基于变窗口模式识别的时间序列缺失值填补方法,其特征在于,所述方法包括如下步骤:
步骤(1),基于运行机理的风电机组有功功率相关性变量选取;
步骤(2),基于数据特征选择的风电机组有功功率相关性变量选取;
步骤(3),针对风电机组有功功率的多维相关性变量的变窗口模式匹配;
步骤(4),基于相似模式的风电机组有功功率连续缺失数据块多重填补;
步骤(5),多重填补结果评价及确认。
本发明的有益效果是:针对工业物联网广泛存在以及常见的数据连续缺失情况,通过本方法可以高效、准确的实现高比例缺失数据的填补,大大提高有效数据量。为机器学习、人工智能等数据驱动类算法的实施和应用奠定了重要的数据基础。
附图说明
图1为数据填补流程图;
图2为基于高斯过程回归算法的数据填补结果;
具体实施方式
下面结合附图对本发明作进一步描述,应当理解,此处所描述的内容仅用于说明和解释本发明,并不用于限定本发明。
风力发电场的数据监测与采集(SCADA)系统处理大量原始数据,例如选取某型号风电机组的风速、有功功率原始数据进行后续分析处理。由于数据采集、传输、存储、弃风限电后的数据清洗等原因,预处理后的风电机组有功功率数据形成了规模不等的数据缺失。其中,由于弃风限电及数据清洗,导致了大量连续缺失数据块的出现。
本发明提供一种基于变窗口模式识别的时间序列缺失值填补方法,针对风力发电系统数据缺失进行处理,所述方法包括如下步骤:
步骤(1),基于运行机理的风电机组有功功率相关性变量选取;
步骤(2),基于数据特征选择的风电机组有功功率相关性变量选取;
步骤(3),针对风电机组有功功率的多维相关性变量的变窗口模式匹配;
步骤(4),基于相似模式的风电机组有功功率连续缺失数据块多重填补;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华能新锐控制技术有限公司,未经北京华能新锐控制技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011402843.6/2.html,转载请声明来源钻瓜专利网。





