[发明专利]分布式大数据采集平台的数据异常监控及修复方法有效
| 申请号: | 201910893778.2 | 申请日: | 2019-09-20 |
| 公开(公告)号: | CN110659273B | 公开(公告)日: | 2022-07-12 |
| 发明(设计)人: | 钱斌;周密;赵云;肖勇;蔡梓文;杨劲锋 | 申请(专利权)人: | 南方电网科学研究院有限责任公司;中国南方电网有限责任公司 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/27 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郭帅 |
| 地址: | 510663 广东省广州市萝岗区科*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分布式 数据 采集 平台 异常 监控 修复 方法 | ||
本发明公开了分布式大数据采集平台的数据异常监控及修复方法,包括:利用大数据采集平台实时收集客户设备的上传数据;根据数据质量校验规则库对所述数据进行数据质量分析,生成异常清单,计算得到实时数据质量指标并发布;其中,所述数据质量校验规则库是在注册数据模型时预设的;利用大数据采集平台对所述异常清单中的异常数据进行辨识和修复。本发明提供的分布式大数据采集平台的数据异常监控及修复方法,适用于基于海量数据采集的用电信息大数据处理和分析,主要解决海量用电数据采集过程中数据出现异常且不能及时处理,导致数据分析结果不可用的问题。
技术领域
本发明涉及大数据处理领域,尤其涉及分布式大数据采集平台的数据异常监控及修复方法。
背景技术
随着国内智能电网技术的发展,大型电力企业在推广智能电能表全面覆盖的过程中也开展了低压集中自动抄表系统的建设。通过建设大数据平台实现了发电、输电、变电、配电、用电等各个环节的电能量数据采集,为电力系统的建设、运行、规划提供了强力的数据支撑。
当前,各类企业通过信息系统的集约化管理实现了业务模型、数据模型的统一,但由于各地系统建设、运维、应用水平参差不齐,容易发生数据缺失、异常等各类问题,不利于在海量信息中开展数据挖掘,无法高效的实现大数据分析,削弱了对公司业务决策支撑力度。
现有技术主要是在采集数据存入数据库后直接进行业务分析,将处理结果与预设的规则库进行比较,当发现分析结果异常时系统自动生成异常工单,通过工单的流转由现场人员发现并处理问题。
现有方案以业务应用为支撑,当发现业务分析结果不可用时通过判据回溯数据问题原因。这种方式在传统的单一线条业务流程上具有较好的处理能力。但是在大数据应用场合下,对现场装置的数据采集频度较高,数据规模大,数据的应用方较多,原有的处理方式处理能力低,时效性较差。
发明内容
本发明提供的分布式大数据采集平台的数据异常监控及修复方法,适用于基于海量数据采集的用电信息大数据处理和分析,主要解决海量用电数据采集过程中数据出现异常且不能及时处理,导致数据分析结果不可用的问题。
为实现上述目的,本发明提供的分布式大数据采集平台的数据异常监控及修复方法,包括:
利用大数据采集平台实时收集客户设备的上传数据;
根据数据质量校验规则库对所述数据进行数据质量分析,生成异常清单,计算得到实时数据质量指标并发布;其中,所述数据质量校验规则库是在注册数据模型时预设的;
利用大数据采集平台对所述异常清单中的异常数据进行辨识和修复。
可选的,根据数据质量校验规则对所述数据进行数据质量分析,生成异常清单进一步包括:
S1:检查所述数据是否完整,若否生成异常清单,若是转到执行S2;
S2:检查所述数据的数据项是否规范,若否生成异常清单,若是数据自动入库,转到执行S3;
S3:检查所述数据是否合理,若否生成异常清单。
可选的,利用大数据采集平台对所述异常清单中的异常数据进行辨识和修复进一步包括,对所述异常数据的空值、零值、连续恒定值和异常倍增值进行辨识。
可选的,利用大数据采集平台对所述异常清单中的异常数据进行辨识和修复进一步包括,在只有少量异常数据时,可利用关联分析法对所述异常数据进行处理。
可选的,利用大数据采集平台对所述异常清单中的异常数据进行辨识和修复进一步包括,结合历史数据、采集点上下游关系、总分关系对所述异常清单中的异常数据进行修复。
可选的,对数据模型注册后进行一致性和合规性审核,设置所述数据模型的数据质量校验规则库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网科学研究院有限责任公司;中国南方电网有限责任公司,未经南方电网科学研究院有限责任公司;中国南方电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910893778.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据清洗方法和系统
- 下一篇:类脑分层记忆机制启发的异常数据流在线校准系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





