[发明专利]一种数据治理方法、装置、电子设备和可读存储介质在审
申请号: | 201911404952.9 | 申请日: | 2019-12-30 |
公开(公告)号: | CN113128804A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 谭梦茜;徐文贵;秦麒;成小海;孙臣臣;刘晓龙;徐皓 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/06;G06F16/18 |
代理公司: | 北京恒博知识产权代理有限公司 11528 | 代理人: | 范胜祥 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 治理 方法 装置 电子设备 可读 存储 介质 | ||
本发明公开了一种数据治理方法、装置、电子设备和可读存储介质。所述方法包括:接收数据资产配置信息;根据所述数据资产配置信息,创建与实体数据源对应的数据资产模型;响应于数据资产预览请求,根据所述数据资产模型对实体数据源中的数据进行解析,展示解析结果。有益效果在于,可以利用数据资产模型对实体数据源的数据资产进行自动化、快速的解析,从而得到解析结果,提高了工作效率。
技术领域
本发明涉及数据资产领域,具体涉及一种数据治理方法、装置、电子设备和可读存储介质。
背景技术
随着信息技术的发展,市场主体在日常经营中积累了大量的与资产与交易紧密关联的数据,并呈现将进一步扩增的趋势。但从数据质量上来看,数据质量往往呈现参差不齐的特点,有的甚至无法进行数据质量评估。数据资产的有效管理和质量维护可以充分利用和挖掘数据价值,进而提升企业竞争力。因此为了提高数据资产的价值和管理水平,需要从字段级别、表级别规则,对数据质量进行评估以帮助用户了解资产的质量情况,根据质量评估情况,再针对性对数据进行打点调整,清洗,优化等数据处理工作。但目前的现有技术中针对不同数据类型且数量庞大的数据资产,解析效果和解析效率不佳。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据治理方法、装置、电子设备和可读存储介质。
依据本发明的一个方面,提供了一种数据治理方法,包括:
接收数据资产配置信息;
根据所述数据资产配置信息,创建与实体数据源对应的数据资产模型;
响应于数据资产预览请求,根据所述数据资产模型对实体数据源中的数据进行解析,展示解析结果。
可选地,所述实体数据源为分布式文件存储系统,所述实体数据源中的数据为日志数据。
可选地,所述数据资产配置信息包括:实体数据源的数据类型;
所述根据所述数据资产模型对实体数据源中的数据进行解析包括:选择与所述数据资产模型中配置的数据类型相匹配的数据解析规则,对实体数据源中的数据进行解析。
可选地,该方法还包括:
接收符合所述数据类型的数据样例;
根据与所述数据类型相匹配的数据解析规则对所述数据样例进行解析,展示解析结果。
可选地,所述数据类型为数组类型,所述方法还包括:接收数组分隔符标识,根据所述数组分隔符标识确定与所述数组类型相匹配的数据解析规则。
可选地,所述数据类型为Nginx日志类型,所述与所述数据资产模型中配置的数据类型相匹配的数据解析规则为:根据默认Nginx日志配置信息和/或自定义Nginx日志配置信息确定的数据解析规则。
可选地,所述数据类型为字符串类型,所述与所述数据资产模型中配置的数据类型相匹配的数据解析规则为:正则表达式解析规则。
可选地,所述数据类型为json类型,所述与所述数据资产模型中配置的数据类型相匹配的数据解析规则为:json对象解析规则。
依据本发明的另一方面,提供了一种数据治理装置,包括:
接收单元,接收数据资产配置信息;
模型单元,根据所述数据资产配置信息,创建与实体数据源对应的数据资产模型;
解析单元,响应于数据资产预览请求,根据所述数据资产模型对实体数据源中的数据进行解析,展示解析结果。
可选地,所述实体数据源为分布式文件存储系统,所述实体数据源中的数据为日志数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911404952.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:D-木酮糖4-差向异构酶、其突变体及其用途
- 下一篇:一种蛋白质的表达方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置