[发明专利]基于大数据的质量分析方法、系统及存储介质在审
申请号: | 202010195431.3 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111475495A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 张勇 | 申请(专利权)人: | 深圳市酷开网络科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06F16/25;G06F11/32 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 宗继颖;吴志益 |
地址: | 518052 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 质量 分析 方法 系统 存储 介质 | ||
本公开所提供的基于大数据的质量分析方法、系统及存储介质,包括:获取终端产生的数据,并监测所获取的数据是否符合预设规则;若所获取数据符合预设规则,则存储符合预设规则的数据,并根据所存储数据编写评分规则,以监测所存储数据在被应用时的流转过程;判断所存储数据在被应用时的变化程度是否达到异常阈值;若达到异常阈值,发出错误警示。通过在数据获取、数据存储以及数据应用过程中对数据进行监测,能够对数据的质量进行管理,以提高数据的质量。
技术领域
本公开涉及数据质量管理技术领域,尤其涉及的是基于大数据的质量分析方法、系统及存储介质。
背景技术
由于数据来源多元化、且数据质量参差不齐,并不利于企业根据多方面收集的数据进行发展规划的制定。
即使市场上出现了对数据质量进行治理的平台,但由于现有的数据质量监测治理平台的针对性不强,在运用过程中需要开发人员进行数据质量的检测,进而导致因数据质量而引发的排查周期过长,且数据越繁杂,排查周期就会对应增长,导致数据质量监测治理平台在应用时的灵活性较差,同时也耗费大量的排查时间,不利于提高数据质量管理的效率,以致于对业务数据质量进行分析时存在明显的缺陷。
因此,现有技术存在缺陷,有待改进与发展。
发明内容
本公开要解决的技术问题在于,针对现有技术的上述缺陷,提供基于大数据的质量分析方法、系统及存储介质,旨在解决现有技术中数据质量监测治理平台的针对性不强,在运用过程中需要开发人员进行数据质量的检测,不利于提高数据质量管理效率的问题。
本公开解决技术问题所采用的技术方案如下:
基于大数据的质量分析方法,其中,包括:
获取终端产生的数据,并监测所获取的数据是否符合预设规则;
若所获取数据符合预设规则,则存储符合预设规则的数据,并根据所存储数据编写评分规则,以监测所存储数据在被应用时的流转过程;
判断所存储数据在被应用时的变化程度是否达到异常阈值;
若达到异常阈值,发出错误警示。
进一步地,所述获取终端产生的数据,并监测所获取的数据是否符合预设规则,之后还包括:
若所获取数据不符合预设规则,则发出错误警示。
进一步地,监测所获取的数据是否符合预设规则包括:
监测获取终端产生数据的响应时间是否在预设时间范围内;
或分析所获取数据的数据结构是否符合预设的数据结构变化范围;
或判断所获取数据的日总量是否超出预设数据总量。
进一步地,存储符合预设规则的数据,并根据所存储数据编写评分规则具体为:
存储符合预设规则的数据,并根据预设数据汇总规则统计所存储数据的日总量,进而根据所汇总的日总量编写评分规则。
进一步地,存储符合预设规则的数据,并根据预设数据汇总规则统计所存储数据的日总量,进而根据所汇总的日总量编写评分规则,之后包括:
监测所汇总数据的日总量是否达到预设评分值;
若否,则发出错误警示。
进一步地,获取终端所产生数据的路径至少包括kafka消息队列、http接口和FTP服务器中一种。
进一步地,监测所存储数据在被应用时的流转过程包括:
根据数据流转的生命周期,监测所存储数据在被应用时,是否存在数据丢失或者数据落地的时间是否在合理时间范围内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市酷开网络科技有限公司,未经深圳市酷开网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010195431.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置