[发明专利]一种基于指标权重的数据质量科学算分评价方法及系统在审
申请号: | 201911010912.6 | 申请日: | 2019-10-23 |
公开(公告)号: | CN110908982A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 余芸;陈彬;徐欢;奚建飞;甘杉;马赟;符飞虎 | 申请(专利权)人: | 南方电网数字电网研究院有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 蔡伟杰 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 指标 权重 数据 质量 科学 评价 方法 系统 | ||
本发明公开了一种基于指标权重的数据质量科学算分评价方法及系统,获取业务数据的评价指标,并对业务数据的评价指标进行综合评分,根据定义的评价指标计算业务数据的权重,根据各评价指标的权重对业务数据的评价指标进行综合评分得到质量评价结果,能够智能的对企业级数据的结构化数据与非结构化数据进行质量分析,并反馈给数据维护人员,对非结构化数据的容错性很好,数据质量分析的识别率高。
技术领域
本公开数据处理技术领域,具体涉及一种基于指标权重的数据质量科学算分评价方法及系统。
背景技术
随着大数据与人工智能的普及,对数据质量要求越来越高,错误的数据将会对企业的运营、决策造成严重的不良后果,因此如何快速提升企业数据质量成为企业信息化建设中至关重要的环节。当企业数据出现质量问题时通常采用配置规则进行评价指标,通过规则校验校验出问题数据,并对问题数据进行问题数据整改,从而提升企业数据质量。然而企业级数据数据存储数据库类型众多、数据量大、数据结构复杂。因此,很难对企业级数据的结构化数据与非结构化数据进行质量分析,从而进行过滤与筛选掉其中的脏数据、低价值的数据,从而选取出其中有价值的数据。
发明内容
为解决上述问题,本公开提供一种基于指标权重的数据质量科学算分评价方法及系统的技术方案,获取业务数据的评价指标,并对业务数据的评价指标进行综合评分,根据定义的评价指标计算业务数据的权重,根据各评价指标的权重对业务数据的评价指标进行综合评分得到质量评价结果。
为了实现上述目的,根据本公开的一方面,提供一种基于指标权重的数据质量科学算分评价方法,所述方法包括以下步骤:
S100,获取业务数据,所述业务数据的类型包括结构化数据与非结构化数据;
S200,获取业务数据的评价指标,并对业务数据的评价指标进行综合评分;
S300,根据定义的评价指标计算业务数据的权重;
S400,根据各评价指标的权重对业务数据的评价指标进行综合评分得到质量评价结果;
S500,对业务数据实际质量评价结果进行统计分析,包括对业务数据运行趋势及业务数据的各类评价指标对比情况;
S600,将统计分析结果以报告的形式反馈给数据维护人员。
进一步地,在S100中,业务数据为根据实际的业务需求对数据进行整理分类的数据,如:资产、营销、人资、财务、生产等数据。
进一步地,在S200中,评价指标为定义业务数据中某数据区域中数据的特征或定义数据质量关键指标,通过评价指标映射业务数据;定义数据质量关键指标为通过评价指标映射业务数据的数据结果的满意程度或业务数据的使用频率。
进一步地,在S200中,对业务数据的评价指标进行综合评分的方法为:评价指标通过对数据结果的满意程度来形容数据质量的优劣。最常见的方式是用户对各个影响因素打分,将满意程度分为若干等级,用户选择对某项评价指标的满意程度的等级;将满意程度等级分为[A]非常满意、[B]满意、[C]一般、[D]差、[E]很差五个等级,则评价指标的满意程度等级得分为:[A]得分为5分,[B]得分为4分,[C]得分为3分,[D]得分为2分,[E]得分为1分。
进一步地,在S300中,计算业务数据的权重的方法为:业务数据的权重=业务数据类型*评价指标的满意程度等级得分;业务数据类型包括结构化数据为2,非结构化数据为1。
进一步地,在S400中,构建综合评分函数:通过公式计算得到质量评价结果Evaluate:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网数字电网研究院有限公司,未经南方电网数字电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911010912.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:气体动力装置
- 下一篇:一种基于A柱显示屏的ADAS预警信息提示装置及方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置