[发明专利]数据仓库异常数据的检测方法及装置有效
申请号: | 201010235550.3 | 申请日: | 2010-07-21 |
公开(公告)号: | CN102339288A | 公开(公告)日: | 2012-02-01 |
发明(设计)人: | 范哲 | 申请(专利权)人: | 中国移动通信集团辽宁有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中誉威圣知识产权代理有限公司 11279 | 代理人: | 彭晓玲;丛芳 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据仓库 异常 数据 检测 方法 装置 | ||
技术领域
本发明涉及管理信息系统及业务支撑领域,具体涉及一种数据仓库异常数据的检测方法及装置。
背景技术
数据仓库对海量数据进行抽取、转换、清洗和加载,从中挖据有分析价值的数据,并通过不断聚集展示分析结果,为市场精准化营销水平和深度运营能力提供了有力支撑。由此,数据质量监控或检测成为数据仓库建设的重中之重,现有检测方法一般包括如下步骤:维护人员通过终端登陆前台系统,并访问经分后台数据库;维护人员通过前台系统的分析结果,如趋势分析图及双条对比分析线等,对系统生成的指标进行检查;分析当日数据与前日数据波动范围比例(或者计算年同期比,月同期环比),分析历史数据并设定波动阀值,在数据波动范围超过阀值时进行数据异常告警;以及,根据检查结果初步分析波动原因,并通过后台数据库表,检查明细,如果指标不正常,则处理故障。
现有数据仓库异常数据的检测技术有如下不足:
(1)凭对历史数据的经验观察设定用于检测异常数据的波动阈值,不能及时、准确地发现系统生成指标的变化异常,同时现有人工监控不能及时在众多的系统生成指标中发现异常数据,数据监控效率低;
(2)数据仓库中大部分数据都具有时序特征,而现有检测方法没有针对数据的时序性进行监控,对具有周期性的数据监控易出现错误告警;
(3)无法监控渐进性异常数据;
(4)不能及时发现系统生成多指标的数据联动异常波动。
发明内容
本发明的第一目的是提出一种准确高的数据仓库异常数据的检测方法。
本发明的第二目的是提出一种准确高的数据仓库异常数据的检测装置。
为实现上述第一目的,本发明提供了一种数据仓库异常数据的检测方法包括:根据指标参数的历史时序数据确定检测阈值,并根据检测阈值确定指标参数的当前时序数据中的初始异常时序数据;根据指标参数的历史时序数据中的异常时序数据,确定异常时序数据的周期;根据周期对初始异常时序数据进行剔重处理,得到当前异常时序数据。
为实现上述第二目的,本发明提供了一种数据仓库异常数据的检测装置,包括:阈值确定模块,用于根据指标参数的历史时序数据确定检测阈值,以及根据指标参数的历史时序数据中的异常时序数据,确定异常时序数据的周期;检测模块,用于根据检测阈值,确定指标参数的当前时序数据中的初始异常时序数据;剔重模块,用于根据周期对初始异常时序数据进行剔重处理,得到当前异常时序数据。
本发明各个实施例通过根据历史时序数据信息确定检测阈值,进而根据该检测阈值确定异常时序数据,克服了凭经验设定阈值不能准确发现数据波动异常的缺点,同时根据历史时序数据的时序信息对根据检测阈值确定的初始异常数据进行周期性异常数据的剔重处理,得到真正异常的当前异常时序数据,提高检测的准确率。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一并用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明的数据仓库异常数据的检测方法的实施例一流程图;
图2为本发明的数据仓库异常数据的检测方法的实施例二流程图;
图3为本发明的数据仓库异常数据的检测装置的实施例结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
方法实施例
图1为本发明的数据仓库异常数据的检测方法的实施例一流程图。如图1所示,本实施例包括:
步骤102:根据指标参数的历史时序数据确定检测阈值,并根据检测阈值确定指标参数的当前时序数据中的初始异常时序数据;详见图2的解释说明;
步骤104:根据指标参数的历史时序数据中的异常时序数据,确定异常时序数据的周期;详见图2的解释说明;
步骤106:根据周期对初始异常时序数据进行剔重处理,得到当前异常时序数据;详见图2的解释说明。
本实施例通过根据历史时序数据信息确定检测阈值,进而根据该检测阈值确定异常时序数据,克服了凭经验设定阈值不能准确发现数据波动异常的缺点,同时根据历史时序数据的时序信息对根据检测阈值确定的初始异常数据进行周期性异常数据的剔重处理,得到真正异常的当前异常时序数据,提高检测的准确率。
图2为本发明的数据仓库异常数据的检测方法的实施例二流程图。如图2所示,本实施例包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团辽宁有限公司,未经中国移动通信集团辽宁有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010235550.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多对象识别方法和装置
- 下一篇:内控型LED数码管系统及其控制方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置