[发明专利]客流数仓数据朔源的方法、装置、系统和存储介质在审
申请号: | 202211712392.5 | 申请日: | 2022-12-29 |
公开(公告)号: | CN115964431A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 张诣元;简锐锋 | 申请(专利权)人: | 交控科技股份有限公司 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/2458;G06F16/248;G06F16/28;G06F16/21 |
代理公司: | 北京科慧致远知识产权代理有限公司 11739 | 代理人: | 李瑞 |
地址: | 100070 北京市丰台区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客流 数据 方法 装置 系统 存储 介质 | ||
1.一种客流数仓数据朔源的方法,其特征在于,包括:
获取轨道交通客流日志数据;包括车站客流、换乘客流、途经客流、列车运力数据源的数据,实现不同数据源的数据采集;
将客流日志数据进行格式化入库解析;
将解析后的客流日志数据导入大数据平台,基于Hadoop大数据技术,实现存储实时和离线精细数据,在大数据存储之上建立ODS层、DWD层、DWS层、ADS层的设计和建模开发工作;
对每层的客流日志数据进行字段级血缘解析,得到客流数据仓库的血缘元数据信息,所述血缘元数据为用于解释所述血缘关系数据的数据;
将获取的血缘元数据信息存入元数据管理平台数据库。
2.根据权利要求1所述的客流数仓数据朔源的方法,其特征在于:
得到客流数仓的血缘元数据信息后,将血缘元数据信息存入Neo4j图数据库进行可视化展示;所述血缘元数据信息至少包括以下字段之一或组合:当前节点名称、父节点名称、子节点名称、表名称、输入对象列表、输出对象列表、表注释、数据源类型、数据库、数据位置、元数据sql文件位置、元数据修改时间。
3.根据权利要求1所述的客流数仓数据朔源的方法,其特征在于:获取轨道交通客流日志数据包括:
通过数据接口和ETL技术连接车站客流、换乘客流、途经客流、列车运力数据源的数据,实现不同数据源的数据采集。
4.根据权利要求1所述的客流数仓数据朔源的方法,其特征在于:将解析后的客流日志数据导入大数据平台,通过对于客流日志数据进行维度建模与分析生成客流数仓,构建ODS,DWD,DWS,ADS层包括:将解析好的客流日志数据导入到大数据平台,基于大数据技术,实现存储实时和离线精细数据,在大数据存储之上建立ODS层、DWD层、DWS层、ADS层;
ODS层属于客流原始数据层,直接从客流日志系统采集最原始的数据;
DWD为明细数据层,按照客流业务不同的数据维度及粒度对原始数据ODS层进行粗粒度的聚合生成;供下游DWS层做进一步数据聚合使用;
DWS为汇聚数据层,客流数据中按照相同维度进行进一步数据聚合的操作;为后续的ADS指标层进行指标计算时的数据调用;
ADS为指标数据层,根据不同的业务指标,根据前期开发的DWD,DWS层数据及指标逻辑进行数据开发,生成指标数据供业务使用。
5.根据权利要求1所述的客流数仓数据朔源的方法,其特征在于:对每层的客流日志数据进行字段级血缘解析,得到客流数仓的血缘元数据信息包括:
(1)注册客流数据字段级血缘解析UDF自定义函数;
(2)重构语义分析器SemanticAnalyzer,重写SQL解析主要逻辑;
(3)客流数仓字段级血缘解析逻辑计划生成和逻辑计划优化;
(4)客流数仓字段级血缘关系解析中,采用单独封装java获取表元数据信息getTableSpec方法实现元数据信息的切换,通过其方法获取相关客流数仓的hive表结构信息Schema,分区信息以及客流数仓表权限信息;
(5)添加钩子函数postExecHook,执行血缘关系日志LineageLogger获得血缘关系信息LineageContext;
(6)读取血缘关系信息LineageContext,组装客流数仓数据表与客流字段血缘关系信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于交控科技股份有限公司,未经交控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211712392.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高致密度的Ta-C涂层的制备方法
- 下一篇:一种大豆籽粒筛选装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置