[发明专利]模型构建方法及装置、数据报表生成方法及装置有效
申请号: | 201710312337.X | 申请日: | 2017-05-05 |
公开(公告)号: | CN108805597B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 艾杰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 陈姗姗 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 构建 方法 装置 数据 报表 生成 | ||
本发明提供一种模型构建方法及装置、数据报表生成方法及装置,该模型构建方法包括:并行执行各基础指标的构建任务,生成若干基础指标表;对各汇总指标的构建任务分别进行时序分析,以确定各汇总指标的最快构建路径;按各最快构建路径分别执行各汇总指标的构建任务,生成若干汇总指标表;根据各基础指标表和各汇总指标表构建数据模型。其中,基础指标的构建任务基于该基础指标所依赖的源数据表执行,汇总指标的构建任务基于该汇总指标所依赖的基础指标表和/或汇总指标表执行。本发明充分利用集群的资源优势,大幅缩短了计算时间,保障了产出结果的时效性。
技术领域
本申请涉及数据处理技术领域,具体涉及一种模型构建方法及装置、数据报表生成方法及装置。
背景技术
在数据集市的建设中,随着业务系统的发展,数据量会不断增大,指标数量不断增多,数据表的依赖关系错综复杂。
一方面,上述问题会导致最终事实表的产生时间变晚,每天都不能及时产出结果以供进行分析和总结,以至于无法利用数据的时效性。例如在每日9点举行的销售早会中需要用到前一日的数据进行分析和总结,若无法在9点前及时产出结果,则无法利用前一日数据的时效性。
另一方面,由于业务情况复杂,需要经常根据竞争对手的动作调整指标,上述问题还会导致每次调整时引起所调整指标下游依赖该指标的整体回溯,回溯任务量非常庞大。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种缩短数据处理时间以保障产出结果时效性的模型构建方法及装置、数据报表生成方法及装置;并期望进一步提供一种减少调整指标后的回溯任务数量的模型构建方法及装置、数据报表生成方法及装置。
第一方面,本发明提供一种模型构建方法,该方法包括:
并行执行各基础指标的构建任务,生成若干基础指标表;
对各汇总指标的构建任务分别进行时序分析,以确定各汇总指标的最快构建路径;
按各最快构建路径分别执行各汇总指标的构建任务,生成若干汇总指标表;
根据各基础指标表和各汇总指标表构建数据模型。
其中,基础指标的构建任务基于该基础指标所依赖的源数据表执行,汇总指标的构建任务基于该汇总指标所依赖的基础指标表和/或汇总指标表执行。
第二方面,本发明还提供一种数据报表生成方法,包括上述模型构建方法,以及,根据该数据模型生成数据报表。
第三方面,本发明提供一种模型构建装置,该装置包括:
基础指标构建单元,配置用于并行执行各基础指标的构建任务,生成若干基础指标表;
时序分析单元,配置用于对各汇总指标的构建任务分别进行时序分析,以确定各汇总指标的最快构建路径;
汇总指标构建单元,配置用于按各最快构建路径分别执行各汇总指标的构建任务,生成若干汇总指标表;
模型构建单元,配置用于根据各基础指标表和各汇总指标表构建数据模型。
其中,基础指标的构建任务基于该基础指标所依赖的源数据表执行,汇总指标的构建任务基于该汇总指标所依赖的基础指标表和/或汇总指标表执行。
第四方面,本发明还提供一种数据报表生成装置,包括上述模型构建装置,以及,报表生成单元,配置用于根据该数据模型生成数据报表。
第五方面,本发明还提供一种设备,包括一个或多个处理器和存储器,其中存储器包含可由该一个或多个处理器执行的指令以使得该一个或多个处理器执行根据本发明各实施例提供的模型构建方法或数据报表生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710312337.X/2.html,转载请声明来源钻瓜专利网。