[发明专利]一种数据分析中可变维度的处理方法在审
| 申请号: | 201410854662.5 | 申请日: | 2014-12-31 |
| 公开(公告)号: | CN104504530A | 公开(公告)日: | 2015-04-08 |
| 发明(设计)人: | 何江 | 申请(专利权)人: | 天津南大通用数据技术股份有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F17/30 |
| 代理公司: | 天津滨海科纬知识产权代理有限公司12211 | 代理人: | 杨慧玲 |
| 地址: | 300384天津市滨海新区高新区华苑*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 分析 可变 维度 处理 方法 | ||
技术领域
本发明属于商务智能领域,尤其涉及一种数据分析中可变维度的处理方法。
背景技术
维度即事物的特征,人们可以使用维度来对事物分类,并进行统计分析。比如按类别统计分析商品销售情况,按供应商分析产品销量情况等等。在大部分数据分析中,一般认为维度是不会改变的,但是,对于某些数据分析来说,也需要跟踪维度变化的过程。
比如在人力资源数据分析中,人们常常按人员的学历来统计员工情况。人员学历这个维度会经常发生变化,比如员工学历可能从本科变更为硕士:那么在学历变更前,应该以本科进行统计,在学历变更后,则应该以硕士来统计。并且在实际操作过程中,还经常出现需要同时对多年统计的情况进行对比的情况。现有技术还不能很好地解决这些问题。
发明内容
本发明要解决的问题是实现一种对可变维度的处理方法,特别适合如人事数据分析中,人员本身不变,但是人员的维度属性经常变化情况下的数据分析。
本发明解决其技术问题所采取的技术方案是:一种数据分析中可变维度的处理方法,包括以下步骤:
第一步:修改维度表存储结构:
在维度表存储结构中增加维度内容的生效时间和过期时间字段,使维度表变成可变维度表;
第二步:对维度改变的字段内容进行记录:
查找变化维度的最后记录,并标记过期时间;然后插入一条新的维度记录,并标记生效时间;
第三步:使用可变维度表进行数据分析:
首先给定分析时间和使用条件,其中分析时间大于等于生效时间,并且过期日期为空或分析时间小于过期时间;然后对可变维度表进行过滤;最后将过滤后结果作为普通维度表与事实表相关联后即可进行分析。
本发明的有益效果是:
(1)本发明所述可变维度表除包含常规维度信息外,还包含维度内容的生效时间和过期时间,这种方式记录了维度信息的有效时间范围,即维度内容在何时起作用,操作方便。
(2)本发明在维度变化时,向维度表中插入变化维度的新记录,这样,在维度表中就包含同一维度的多条记录,即保存了维度变化的完整历史;并且,查找变化维度的最后记录,并标记过期时间;然后插入一条新的维度记录,并标记生效时间,这就保证了同一维度多条记录间的顺序性,即在任何时候,同一维度的多条记录中只有一条记录起作用。
(3)在数据分析时,给定分析时间,然后使用分析时间对可变维度表进行过滤,这就保证了对可变维度表的使用。同时本发明限定了过滤条件为:分析时间大于等于生效时间,并且过期日期为空或分析时间小于过期时间,保证了在给定分析时间,在统一维度的多条记录中有且只有一条记录满足过滤条件,即可将变维度表转换成为了普通维度表。
具体实施方式
下面对本发明的技术方案进一步阐述:
实施例:一种数据分析中可变维度的处理方法,包括以下步骤:
第一步:修改维度表存储结构:在维度表存储结构中增加维度内容的生效时间和过期时间字段,使维度表变成可变维度表;
普通维度表如下:
修改为可变维度表后如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津南大通用数据技术股份有限公司;,未经天津南大通用数据技术股份有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410854662.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:终端事件提醒方法和系统
- 下一篇:基于GIS的配电网输变配一体化运行管理系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





