[发明专利]构建数据仓库的方法及装置有效
| 申请号: | 201910563806.4 | 申请日: | 2019-06-26 |
| 公开(公告)号: | CN110297818B | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 王超群;林必红 | 申请(专利权)人: | 杭州数梦工场科技有限公司 |
| 主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/25;G06F16/28 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 陈蕾 |
| 地址: | 310024 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 构建 数据仓库 方法 装置 | ||
1.一种构建数据仓库的方法,其特征在于,所述数据仓库包括一个或多个主题库,所述方法包括:
设置主题优先级配置表,所述主题优先级配置表用于配置各个指定主题属性在各个指定数据源中的优先级,所述主题优先级配置表中包括预留字段,所述预留字段是用于后续扩展的预留数据源、和/或预留主题属性的字段;
根据所述各个指定主题属性在各个指定数据源中的优先级,确定各个所述指定主题属性对应的主题数据和所述主题数据的溯源,得到主题溯源表;
根据所述主题溯源表生成用于表征所述主题库的主题表;
所述根据所述主题溯源表生成用于表征所述主题库的主题表,包括:
删除所述主题溯源表中包括的所述主题数据的溯源,得到主题临时表;
设置主题临时表到主题表的映射表,所述映射表中包括主题临时表字段和主题表字段之间的映射关系;
根据所述映射表确定所述主题临时表对应的所述主题表。
2.根据权利要求1所述的方法,其特征在于,所述指定主题属性是从各个所述指定数据源中抽取出的用于描述所述主题库的主题属性;所述指定数据源是指定用于构建所述主题库的数据源。
3.根据权利要求1或2所述的方法,其特征在于,所述主题优先级配置表中包括用于描述所述指定数据源的第一类字段、用于描述所述指定主题属性的第二类字段、以及用于描述所述指定主题属性在各个所述指定数据源中的优先级的第三类字段,其中,所述优先级采用数值形式描述且存在预设跨度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述各个指定主题属性在各个指定数据源中的优先级,确定各个指定主题属性对应的主题数据和所述主题数据的溯源,得到主题溯源表,包括:
针对任一所述指定主题属性,根据该指定主题属性在各个指定数据源中的优先级,选出最高优先级对应的所述指定数据源;
当在最高优先级对应的所述指定数据源中、且该指定主题属性对应的源数据为有效数据时,则将该指定主题属性对应的源数据确定为该指定主题属性对应的主题数据,并将最高优先级对应的所述指定数据源确定为该主题数据的溯源,得到所述主题溯源表;
当在最高优先级对应的所述指定数据源中、且该指定主题属性对应的源数据为无效数据时,则根据该指定主题属性在各个指定数据源中的优先级中,选出次高优先级对应的所述指定数据源,直至查询到该指定主题属性对应的源数据为有效数据时,确定对应的所述主题溯源表。
5.根据权利要求1或4所述的方法,其特征在于,所述主题溯源表中包括用于描述各个所述指定主题属性对应的主题数据的第四字段、以及用于描述所述主题数据的溯源的第五字段。
6.根据权利要求1所述的方法,其特征在于,所述主题临时表字段中包括的第一字段数据是所述主题临时表中包括的各个指定主题属性;所述主题表字段中包括的第二字段数据是所述主题表中包括的各个指定主题属性,所述映射关系中包括所述主题临时表中包括的各个指定主题属性和所述主题表中包括的各个指定主题属性之间的第一映射关系;
所述主题临时表字段中包括的第三字段数据是所述主题临时表中包括的各个预留主题属性;所述主题表字段中包括的第四字段数据是所述主题表中包括的各个预留主题属性;所述映射关系中包括所述主题临时表中包括的各个预留主题属性和所述主题表中包括的各个预留主题属性之间的第二映射关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数梦工场科技有限公司,未经杭州数梦工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910563806.4/1.html,转载请声明来源钻瓜专利网。





