[发明专利]一种设备状态监测数据质量评测体系的构建方法在审
申请号: | 201710539092.4 | 申请日: | 2017-07-04 |
公开(公告)号: | CN107368957A | 公开(公告)日: | 2017-11-21 |
发明(设计)人: | 邬蓉蓉;张炜;黎大健;蒲金雨;王乐;张玉波 | 申请(专利权)人: | 广西电网有限责任公司电力科学研究院 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 南宁东智知识产权代理事务所(特殊普通合伙)45117 | 代理人: | 戴燕桃,巢雄辉 |
地址: | 530023 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 设备 状态 监测 数据 质量 评测 体系 构建 方法 | ||
技术领域
本发明涉及数据处理技术领域,尤其涉及一种设备状态监测数据质量评测体系的构建方法。
背景技术
在信息时代以大数据为代表的信息技术正以前所未有的广度、深度与电网生产运行和管理快速融合,发挥着越来越重要的作用,成为新时期电网生产管理精益转型的助推器。大数据的核心在于对产生的海量数据进行挖掘和分析,从而快速地获取有价值信息,转化为知识并进行决策和预判。由于生产数据量非常庞大,且分散在各个信息系统,彼此孤立,未能得到有效整合和共享,数据完整性、准确性、一致性等质量问题依然存在。目前数据质量提升面临的主要问题有以下几个方面:
(1)数据来源多:一方面体现在由于信息系统的分散建设,处理数据质量的源头系统多,另一方面体现在同一类数据甚至是同一个属性,可能来源与不同的系统,由于缺少血缘分析,对一部分数据甚至不清楚其源头是哪里;
(2)质量差:包括由于各类字典项不完善导致的产生大量的意义模糊甚至无意义的数据,部分出厂交接的数据以纸质形式存在,旧系统的结构化数据因为没有良好的维护变成无意义的结构化数据;
(3)处理慢:当前电网公司的生产域信息系统处于从历史上分散独立建设向一体化建设的过度阶段,因此系统建设推进和历史数据迁移处于主导地位,数据质量治理工作进展稍处于弱势的地位而没有明显的改善。
因此,针对业务数据数量多、种类庞杂、横跨专业多等特点而引起的数据质量不高的现状,如何利用现有的数据,提高数据质量,满足不同企业的需求是当前面临的一个重要问题。
发明内容
为克服现有技术中存在的不足,本发明提出了一种设备状态监测数据质量评测体系的构建方法,所述方法的技术方案为:
一种设备状态监测数据质量评测体系的构建方法,包括以下步骤:
S1:分析影响数据质量的因素以及存在的数据质量问题;
S2:确定适合所述数据质量的评价维度;
S3:根据步骤S1、S2的分析结果,构建所述数据质量的校验规则;
S4:基于步骤S3所述的校验规则,构建所述数据质量的评价模型。
优选的,所述步骤S1中影响数据质量的因素包括字段、记录、记录类型和数据源。
优选的,所述步骤S2中的评价维度包含完整性、唯一性、一致性、合法性、精确性和及时性。
优选的,所述完整性是表征数据的完备性维度,包含数据的实体缺失、字段缺失、记录缺失和字段值缺失;
所述唯一性是表征数据的唯一性维度,包含数据的主键唯一和候选键唯一;
所述一致性是表征数据关联关系的维度,包含数据来源、冗余存储和数据口径;
所述合法性是表征数据是否在科学合理的范围内,包含数据的格式、类型、域值和业务规则的有效性;
所述精确性是表征数据的精确程度,包含数据格式、数据位数和数据结构的准确性;
所述及时性是表征数据维护的及时性,包含数据接入、数据上传、数据维护和数据应用的及时性。
优选的,所述步骤S2具体包括根据不同的数据类型确定不同的评价维度,所述数据类型包括基础数据、离线运维数据、在线监测数据和指标数据。
优选的,所述基础数据包括台帐数据、规则库、计算方法和计算模型,所述离线运维数据包括设备的缺陷记录数据、预防性试验记录及试验报告数据,所述在线监测数据包括对设备状态实时监测所获得的数据,所述指标数据包括技术指标数据和业务指标数据。
优选的,所述技术指标数据包括数据同步或者数据上送的及时率、成功率、总耗时,以及数据传输的可靠性、经济性、稳定性指标,所述业务指标数据包含设备台帐、运维、在线监测、状态评价、故障预测、技术监督涉及的数据和开展的业务应用的核心指标数据。
优选的,所述基础数据的评价维度包括完整性、唯一性、一致性和合法性,所述离线运维数据的评价维度包括完整性、唯一性、精确性和合法性,所述在线监测数据的评价维度包括完整性、一致性、精确性和及时性,所述指标数据的评价维度包括一致性和及时性。
优选的,所述步骤S3中的校验规则是基于电气物理规律及人工数据判别规律建立的,其生成流程如下:
(1)基础数据规则:数据的特征较为简单,只对完整性、唯一性、一致性和合法性简单的指标进行校核;
(2)在线监测数据规则:首先关联到基础数据规则,通过设备定位,校验相关的基础数据规则,然后校验在线监测数据的规则,包括对的数据完整性、一致性、精确性和及时性的指标进行校验;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西电网有限责任公司电力科学研究院,未经广西电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710539092.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置