[发明专利]一种基于维度层次结构特征的OLAP查询间距离计算方法有效
| 申请号: | 201210562292.9 | 申请日: | 2012-12-17 |
| 公开(公告)号: | CN103064923A | 公开(公告)日: | 2013-04-24 |
| 发明(设计)人: | 陈益;解正宇;陈岭;刘荣游 | 申请(专利权)人: | 浙江鸿程计算机系统有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 310012 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 维度 层次 结构 特征 olap 查询 间距 计算方法 | ||
技术领域
本发明涉及计算机数据仓库技术领域,具体涉及一种通过维度层次结构特征来计算OLAP查询间距离的方法。
背景技术
随着政府、企业业务的不断整合以及数据仓库的实施,基于数据仓库的决策分析成为实现数据价值增值的普遍需求。OLAP支持分析人员和决策者从多个角度对数据仓库数据进行快速、一致、交互地访问。在海量的数据仓库数据中如何能找到我们需要的数据甚至如何从中挖掘出一些我们不曾了解的隐藏信息成为数据挖掘的一个重要研究方向。在这个研究方向中,如何能量化两个OLAP查询的相似性是一个关键,而计算OLAP查询相似性需要OLAP查询间距离计算方法。
现有计算OLAP查询间距离方法一般先使用经典Hamming距离计算单元格间距离,然后使用Hausdorff距离计算查询间距离,这些方法只是简单比较单元格在不同维度上的成员值是否相等,未充分利用数据仓库中数据具有层次性的特征。在同一维度上,OLAP可通过上卷、下钻操作实现成员值之间的转化,Hamming距离只判断两个成员值是否相等而不考虑两个成员值间的层次关系,因此不能充分发现维度上成员值之间的相似性,进而不能充分发现两个OLAP查询间的相似性。在计算查询间距离时,Hausdorff距离对噪声和孤立点比较敏感,因而容易导致距离误差。
发明内容
本发明为克服上述的不足之处,目的在于提供一种新的在充分考虑了OLAP查询中各个维度具有层次结构特征的OLAP查询间距离的计算方法。
本发明是通过以下技术方案达到上述目的:
一种基于维度层次结构特征的OLAP查询间距离计算方法,包括以下步骤;
1)定义数据立方体中立方体、维度、单元格和单元格集合各个数据结构;
定义1(立方体)n维立方体C=<D1,...,Dn,F>可以被定义成n+1维关系,其中Di表示第i个维度,F表示事实表。
定义2(维度)维度D=(H,<),H={h1,...,hk}是该维度上层次的集合,<是H上的线性序关系,即h2∈H→h1<h2或h2<h1,如果h1<h2,则称h1低于h2,dom(D)表示维度D中所有值的集合,成员值r是维度表中的值,即r∈dom(D)。
定义3(单元格)给定一个n维的立方体C,单元格是一个n维元组<r1,...,rn>,对于每个i∈[1,n],有ri∈dom(Di)。
定义4(单元格集合)给定一个n维立方体C=<D1,...,Dn,F>,对于i∈[1,n],n维立方体的单元格集合为R1×...×Rn。
2)使用MDX解析器对以MDX语句表达的OLAP查询进行解析,获取OLAP查询涉及数据立方体中的单元格集合;
MDX解析器完成从MDX查询到单元格集合的解析,MDX解析器的工作流程图包括词法分析、语法分析、语义处理和获取单元格集合四个步骤,下面依次介绍各个步骤:
2.1)词法分析:词法分析器对MDX语句从左到右进行扫描,按词法规则识别单词符号,并产生用于语法分析的终结符流;过滤掉MDX语句中的注释和空白;记录输入的MDX字符串的位置信息,用于出现词法或语法错误时,出错处理模块可以报告输入MDX语句错误的具体位置。
2.2)语法分析:语法分析器从词法分析器读入终结符流,并从终结符流中识别各类语法成分,根据设计的MDX文法,找出MDX语句的结构从而检测MDX语句中的语法错误。如果检测出错误,则调用出错模块进行处理;如果语法正确,则根据语法分析器所生成的动作序列构造MDX语句的语法树和符号表,提供给语义处理部件使用。
2.3)语义处理:语义处理是检查语法的正确性并确认语句有意义,语义分析器读入每一个符号,按照语义规则创建节点,生成一棵语义正确的语法树。
2.4)获取单元格集合:MDX语句生成语法树之后,还不足以获取维度上成员值的所有信息,通过访问元数据信息,处理函数求值,最后获取单元格集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鸿程计算机系统有限公司,未经浙江鸿程计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210562292.9/2.html,转载请声明来源钻瓜专利网。





