[发明专利]客流数仓数据朔源的方法、装置、系统和存储介质在审
申请号: | 202211712392.5 | 申请日: | 2022-12-29 |
公开(公告)号: | CN115964431A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 张诣元;简锐锋 | 申请(专利权)人: | 交控科技股份有限公司 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/2458;G06F16/248;G06F16/28;G06F16/21 |
代理公司: | 北京科慧致远知识产权代理有限公司 11739 | 代理人: | 李瑞 |
地址: | 100070 北京市丰台区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客流 数据 方法 装置 系统 存储 介质 | ||
本申请实施例提供一种客流数仓数据朔源的方法、装置、系统和存储介质,其中,方法包括:获取轨道交通客流日志数据;将客流日志数据进行格式化入库解析;将解析后的客流日志数据导入大数据平台,通过对于客流日志数据进行维度建模与分析生成客流数仓,构建ODS,DWD,DWS,ADS层;对每层的客流日志数据进行字段级血缘解析,得到客流数仓的血缘元数据信息;将获取的血缘元数据信息存入元数据管理平台数据库。本申请实施例提供的客流数仓数据朔源方法实现了客流数仓数据可朔源,提高了数仓数据质量可评估性,便于对客流数仓的数据价值进行进一步的挖掘,为数据安全提供了有力的保障。
技术领域
本申请涉及表级别、字段级别的数仓血缘关系的解析技术领域,尤其是涉及一种客流数仓数据朔源的方法、装置、系统和存储介质。
背景技术
数字经济是以数据资源为关键要素,以现代信息网络为主要载体,以信息通信技术融合应用、全要素数字化转型为重要推动力,促进公平与效率更加统一的新经济形态,可见数字化时代已成必然趋势。
当前数据安全已成为事关国家安全与经济社会发展的重大问题,与此同时国家相继出台了《数据安全法(草案)》和《个人信息保护法》,旨在为落实数据安全保护责任。可见数据对于个人、企业乃至国家的重要性是不言而喻的。
现有公司数仓体系数据朔源难,一旦出现了数据问题,需要开发人员逐一去开发脚本里一个一个去找关联关系,使得数仓运维及数据追责变得极为困难。问题体现在如下方面:
1、客流系统的客流日志数据的采集和汇总、解析、注入大数据系统的问题;2、没有有效的利用客流的客流日志数据;
3、不方便客流数仓数据价值的挖掘及客流数仓数据质量的评估。
发明内容
为了解决上述技术缺陷之一,本申请实施例中提供了一种客流数仓数据朔源的方法、装置、系统和存储介质。
根据本申请实施例的第一个方面,提供了一种客流数仓数据朔源的方法,包括:
获取轨道交通客流日志数据;包括车站客流、换乘客流、途经客流、列车运力数据源的数据,实现不同数据源的数据采集;
将客流日志数据进行格式化入库解析;
将解析后的客流日志数据导入大数据平台,基于Hadoop大数据技术,实现存储实时和离线精细数据,在大数据存储之上建立ODS层、DWD层、DWS层、ADS层的设计和建模开发工作;
对每层的客流日志数据进行字段级血缘解析,得到客流数据仓库的血缘元数据信息,所述血缘元数据为用于解释所述血缘关系数据的数据;
将获取的血缘元数据信息存入元数据管理平台数据库。
根据本申请实施例的第二个方面,提供了一种客流数仓数据朔源的装置,包括;
获取单元,用于获取轨道交通客流日志数据;包括车站客流、换乘客流、途经客流、列车运力数据源的数据,实现不同数据源的数据采集;
格式化入库解析单元,用于将客流日志数据进行格式化入库解析;
导入单元,用于将解析后的客流日志数据导入大数据平台,基于Hadoop大数据技术,实现存储实时和离线精细数据,在大数据存储之上建立ODS层、DWD层、DWS层、ADS层的设计和建模开发工作;
生成单元,用于通过对于客流日志数据进行维度建模与分析生成客流数仓;
构建单元,用于构建ODS,DWD,DWS,ADS层;
字段级血缘解析单元,用于对每层的客流日志数据进行字段级血缘解析,得到客流数仓的血缘元数据信息;
储存单元,用于将获取的血缘元数据信息存入元数据管理平台数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于交控科技股份有限公司,未经交控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211712392.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高致密度的Ta-C涂层的制备方法
- 下一篇:一种大豆籽粒筛选装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置