[发明专利]基于时间序列的异常数据检测方法、装置、介质和设备有效
申请号: | 201911285902.3 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111104736B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 高嘉欣;胡文波;陈云天;田天 | 申请(专利权)人: | 北京瑞莱智慧科技有限公司 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G01D21/02 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 韩雪梅 |
地址: | 100086 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时间 序列 异常 数据 检测 方法 装置 介质 设备 | ||
本发明的实施方式提供了一种基于时间序列的异常数据检测方法。该异常数据检测方法包括:获取至少一个第一监测量的监测数据和第二监测量的监测数据;基于特定的时序数据预测模型和至少一个第一监测量的监测数据得到对第二监测量的预测;若第二监测量的监测数据与预测不对应,则确定第二监测量的监测数据为异常数据。本发明的方法可以提高对数据进行异常检测的效率。此外,本发明的实施方式提供了一种基于时间序列的异常数据检测装置、介质和计算设备。
技术领域
本发明的实施方式涉及大数据技术领域,更具体地,本发明的实施方式涉及基于时间序列的异常数据检测方法及装置、介质和设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在工业生产中,通常会对设备的运行指标进行监测,从而判断设备的运行情况是否良好。例如,对发电设备——大坝的运行指标(如上游水位、下游水位、水平位移、沉陷位移、渗流等)进行监测,进而通过评估这些指标是否异常来确定设备是否存在运行风险。
目前对指标是否异常的判断通常由人工实地勘测的方式进行数据校验,这使得在设备运行时无法快速发现存在的异常数据,不利于对设备的运行情况进行有效评估。例如,对大坝的水平位移的监测数据通常采用预置传感器获取,并由专家技术人员根据传感器获取到的值定期进行实地考察,依据经验判断传感器检测到的物理量数据是否异常,这种异常数据的检测方法依赖专家技术人员的主观经验,不同专家技术人员的判断可能存在较大差异,误判的可能性较大,且实际应用中需要花费较大的人力物力,检测效率不高。
发明内容
为此,发明实施例提出了一种改进的基于时间序列的异常数据检测方法及装置、介质和计算设备,可以提高对数据进行异常检测的效率。
在本上下文中,本发明的实施方式期望提供一种基于时间序列的异常数据检测方法。
在本发明实施方式的第一方面中,提供了一种基于时间序列的异常数据检测方法,包括:
获取至少一个第一监测量的监测数据和第二监测量的监测数据,其中,所述第一监测量的监测数据和第二监测量的监测数据在时序上对应;
基于特定的时序数据预测模型和至少一个所述第一监测量的监测数据得到对所述第二监测量的预测,其中,所述时序数据预测模型包括至少一个拟合所述第一监测量和所述第二监测量的数据的特征信息的核函数;
若所述第二监测量的监测数据与所述预测不对应,则确定所述第二监测量的监测数据为异常数据。
在本发明的一个实施例中,所述时序数据预测模型基于所述至少一个第一监测量的历史监测数据和所述第二监测量的历史监测数据训练得到。
在本发明的另一实施例中,所述时序数据预测模型采用多种核函数分别拟合所述数据的多个维度的特征信息。
在本发明的另一实施例中,所述多种核函数包括径向基核函数、正弦平方核函数、常数核函数、白噪声核函数之中的至少两项。
在本发明的另一实施例中,所述数据的多个维度的特征信息至少包括以下之二:
数据的趋势信息;
数据的周期信息;
数据的噪声。
在本发明的另一实施例中,所述时序数据预测模型在拟合所述数据的趋势信息时,采用径向基核函数;
在拟合所述数据的周期信息时,采用正弦平方核函数;
在拟合所述数据的噪声时,采用白噪声核函数。
在本发明的另一实施例中,所述时序数据预测模型为高斯过程回归模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京瑞莱智慧科技有限公司,未经北京瑞莱智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911285902.3/2.html,转载请声明来源钻瓜专利网。