[发明专利]构建数据仓库的方法及装置有效
| 申请号: | 201910563806.4 | 申请日: | 2019-06-26 |
| 公开(公告)号: | CN110297818B | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 王超群;林必红 | 申请(专利权)人: | 杭州数梦工场科技有限公司 |
| 主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/25;G06F16/28 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 陈蕾 |
| 地址: | 310024 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 构建 数据仓库 方法 装置 | ||
本公开提供一种构建数据仓库的方法,所述数据仓库包括一个或多个主题库,所述方法包括:设置主题优先级配置表,所述主题优先级配置表用于配置各个指定主题属性在各个指定数据源中的优先级;根据所述各个指定主题属性在各个指定数据源中的优先级,确定各个所述指定主题属性对应的主题数据和所述主题数据的溯源,得到主题溯源表;根据所述主题溯源表生成用于表征所述主题库的主题表。因此,本公开实现了数据仓库的纵向扩展、横向扩展和溯源,还提高了构建数据仓库的可靠性。
技术领域
本公开涉及计算机通信技术领域,尤其涉及一种构建数据仓库的方法及装置。
背景技术
数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
相关技术中,数据仓库是面向主题的,并且数据仓库中的数据是按照一定的主题域进行组织的。其中,这里的主题指的是指用户使用数据仓库进行决策时所关心的重点方面。比如:在公安系统的数据仓库里,可以把数据分为:人、地、事、物、案等几大主题。对于人的主题库的构建,可以分为以下几个步骤:(1)先依据人的特点,根据公安的业务知识,建立起人的宽表;(2)从现有的业务数据中,整理抽取出宽表中想要的字段;(3)当多张业务表具有同一个字段时,选择可信度最高的那个表中的数据。
但是,在上述面向主题的数据仓库的构建中,需要去比较多张表中的数据,需要区分到数据表中的每一个字段,若多张表存在同一意义的字段时,不仅需要区分优先级,还需要区分每条数据的有效性,其实现过程非常复杂,同时也不利于数据仓库的纵向扩展、横向扩展和溯源。
发明内容
为克服相关技术中存在的问题,本公开提供了一种构建数据仓库的方法及装置。
根据本公开实施例的第一方面,提供一种构建数据仓库的方法,所述数据仓库包括一个或多个主题库,所述方法包括:
设置主题优先级配置表,所述主题优先级配置表用于配置各个指定主题属性在各个指定数据源中的优先级;
根据所述各个指定主题属性在各个指定数据源中的优先级,确定各个所述指定主题属性对应的主题数据和所述主题数据的溯源,得到主题溯源表;
根据所述主题溯源表生成用于表征所述主题库的主题表。根据本公开实施例的第二方面,提供一种构建数据仓库的装置,所述数据仓库包括一个或多个主题库,所述装置包括:
设置模块,被配置为设置主题优先级配置表,所述主题优先级配置表用于配置各个指定主题属性在各个指定数据源中的优先级;
确定模块,被配置为根据所述各个指定主题属性在各个指定数据源中的优先级,确定各个所述指定主题属性对应的主题数据和所述主题数据的溯源,得到主题溯源表;
生成模块,被配置为根据所述主题溯源表生成用于表征所述主题库的主题表。
根据本公开实施例的第三方面,提供一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面提供的构建数据仓库的方法。
根据本公开实施例的第四方面,提供一种构建数据仓库的装置,所述数据仓库包括一个或多个主题库,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
设置主题优先级配置表,所述主题优先级配置表用于配置各个指定主题属性在各个指定数据源中的优先级;
根据所述各个指定主题属性在各个指定数据源中的优先级,确定各个所述指定主题属性对应的主题数据和所述主题数据的溯源,得到主题溯源表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数梦工场科技有限公司,未经杭州数梦工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910563806.4/2.html,转载请声明来源钻瓜专利网。





