[发明专利]获取元数据质量信息的方法、装置、电子设备和介质在审
| 申请号: | 202110771592.7 | 申请日: | 2021-07-08 |
| 公开(公告)号: | CN113392076A | 公开(公告)日: | 2021-09-14 |
| 发明(设计)人: | 杨泽森 | 申请(专利权)人: | 网银在线(北京)科技有限公司 |
| 主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/14;G06F16/182;G06F16/23;G06F16/215 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100080 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 获取 数据 质量 信息 方法 装置 电子设备 介质 | ||
本公开的实施例公开了获取元数据质量信息的方法、装置、电子设备和介质。该方法的一具体实施方式包括:获取针对目标数据系统的元数据信息集合;按照至少两个预设维度生成该元数据信息集合对应的分数,其中,该预设维度包括以下至少一项:元数据完整度,元数据准确度,元数据贡献度;根据该至少两个预设维度对应的权重与至少两个预设维度对应的分数,生成该元数据信息集合的质量信息。该实施方式实现了元数据的质量信息的自动生成,从而为支持不同用户对元数据管理或使用的需求提供技术基础。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及获取元数据质量信息的方法、装置、电子设备和介质。
背景技术
随着互联网技术的飞速发展,数据规模也不断扩大,企业业务信息、舆情信息、第三方信息等各类数据资产信息不断增长,企业为了实现数据信息对业务增长的价值变现,就需要对企业所涉及的所有数据资产信息构建企业元数据系统,也叫做数据目录系统,用以支持企业决策分析、数据分析、数据挖掘等数据工作,支持企业营销、运营,为各类企业经营管理人员更加充分了解企业具有的数据资产分类、数据资产范围、数据资产数量、数据资产质量等提供服务。
目前,不同行业背景的很多企业都建设了数据资产元数据 (Metadata)系统,例如hive数据仓库(Data Warehouse,DW)。现有元数据系统通常只有元数据的基础信息,在大数据(big data)时代,由于数据量巨大,如何判断元数据系统中的数据的质量需要更加数字化、智能化的方法。
发明内容
本公开的实施例提出了获取元数据质量信息的方法、装置、电子设备和介质。
第一方面,本公开的实施例提供了一种获取元数据质量信息的方法,该方法包括:获取针对目标数据系统的元数据信息集合;按照至少两个预设维度生成元数据信息集合对应的分数,其中,预设维度包括以下至少一项:元数据完整度,元数据准确度,元数据贡献度;根据至少两个预设维度对应的权重与至少两个预设维度对应的分数,生成元数据信息集合的质量信息。
在一些实施例中,上述预设维度包括元数据完整度;以及上述按照至少两个预设维度生成元数据信息集合对应的分数,包括:按照至少两个预设完整度子维度生成元数据信息集合对应的子分数,其中,完整度子维度包括以下至少一项:多语种对照描述得分,业务用途描述得分,使用方法描述得分,枚举字段描述得分;根据至少两个预设完整度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的准确度维度的分数。
在一些实施例中,上述预设维度包括元数据准确度;以及上述按照至少两个预设维度生成元数据信息集合对应的分数,包括:按照至少两个预设准确度子维度生成元数据信息集合对应的子分数,其中,准确度子维度包括以下至少一项:维护人信息得分,更新信息得分,枚举数据完整度得分;根据至少两个预设准确度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的准确度维度的分数。
在一些实施例中,上述预设维度包括元数据贡献度;以及上述按照至少两个预设维度生成元数据信息集合对应的分数,包括:按照至少两个预设贡献度子维度生成元数据信息集合对应的子分数,其中,贡献度子维度包括以下至少一项:用户满意度得分,元数据热度得分,元数据权威性得分;根据至少两个预设贡献度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的贡献度维度的分数。
在一些实施例中,在根据至少两个预设维度对应的权重与对应的所生成的分数,生成元数据信息集合的质量信息之前,该方法还包括:接收目标用户端发送的权重设置值;基于权重设置值,确定以下至少一项:预设维度对应的权重,预设完整度子维度对应的权重,预设准确度子维度对应的权重,预设贡献度子维度对应的权重。
在一些实施例中,该方法还包括:将质量信息存入预设的数据质量信息库;根据数据质量信息库中的质量信息,生成可视化报表,其中,可视化报表包括以下至少一项:与至少两个预设维度对应的分数呈现信息,质量信息的历史变化呈现信息,质量信息排名呈现信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网银在线(北京)科技有限公司,未经网银在线(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110771592.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





