[发明专利]基于事务访问模式识别联结关系有效
申请号: | 201580069987.5 | 申请日: | 2015-12-21 |
公开(公告)号: | CN107408114B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 阿努拉格·温德拉斯·古普塔;蒂莫西·安德鲁·拉斯;斯里尼瓦桑·孙达尔·拉加万;桑托什·凯克 | 申请(专利权)人: | 亚马逊技术有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/27;G06F16/28;G06F16/242 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 黄亮 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 事务 访问 模式识别 联结 关系 | ||
可使用描述用于访问事务数据存储区的查询的信息语料库来识别模式中未明确定义或用户未提供的分析关系。可基于语料库中的查询元素中的字段重合来识别联结关系。联结关系可指示维度和维度的属性。可基于包括数据类型、汇总子句中的引用以及分组子句中的引用的因素来识别维度的分层级别。
相关申请的交叉参考
本申请要求于2014年12月22日提交的美国专利申请No.14/578,786的权益,其公开内容通过引用整体并入本文。
技术领域
背景技术
数据仓库与在线分析处理(“OLAP”)系统可包括允许分析查询的自动产生的各种工具。在一些情况下,这些工具可能依赖于用户来提供关于待分析的数据的结构的各种细节。然而,提供此信息可能是所涉及的进程。在其他情况下,工具可以使用经明确定义的模式信息(例如,主键和外键的关系)自动产生分析查询。然而,即使未经明确定义,分析上有用的关系也可能存在。也可能存在分析工具的用户不知道的分析上有用的关系。
发明内容
附图说明
当结合附图阅读时,可以更好地理解以下详细描述。出于示出的目的,附图中展示了本公开的各方面的各种示例;然而,本发明并不限于所公开的具体方法和手段。
图1是描绘用于基于在事务数据库管理系统中访问数据的模式来执行分层和联结路径的自动检测的系统的实施方案的框图。
图2是描绘包括实施方案可在检测联结路径和分层中利用的元素的查询的示例的框图。
图3是描绘可由实施方案使用以基于重合字段的重复规格来识别潜在联结关系及维度的多个查询的示例的框图。
图4是描绘用于基于识别由事务数据库系统处理的多个查询中的维度和级别来形成分层的进程的实施方案的流程图。
图5是描绘用于基于事务访问模式来识别联结路径的进程的实施方案的流程图。
图6是描绘可以实践本公开的各方面的计算环境的实施方案的框图。
图7是描绘可以在上面实践本公开的各方面的计算系统的实施方案的框图。
具体实施方式
可以采用本公开的各方面来识别可用于对事务数据执行分析操作的联结关系。可以利用联结关系来自动产生分析查询,例如可用于产生可用于分析的分层的查询。本公开的实施方案可以利用来自例如关系数据库管理系统的事务数据存储区的查询日志来识别未由模式或元数据明确识别的联结关系。可以进一步利用联结路径来识别维度和相关联的属性,且识别可由维度属性的汇总(aggregation)形成的分层和其他分析关系。
用于识别分析关系的系统可包括通信地耦合到事务数据存储区的计算节点。计算节点可包括具有用于接收含有用于访问事务数据存储区的查询的事务或诊断日志的指令的存储器。通过分析日志中所含有的查询信息的语料库,实施方案可以识别维度和与维度相关的属性。识别可以是至少部分地基于用于访问事务数据存储区的查询中的字段的重合引用。可以选择具有相对高的重合频率的字段作为与维度相关的属性。可以基于针对维度和相关联的属性所基于的字段引用分析查询信息的语料库来识别与维度相关联的分层的级别。将这些字段包括在汇总子句和分组子句中可能暗示可在分层内汇总的分层级别和属性。这些字段的数据类型也可能暗示分层级别和属性。
图1是描绘用于基于在事务数据库管理系统中访问数据的模式来执行分层和联结路径的自动检测的系统的实施方案的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亚马逊技术有限公司,未经亚马逊技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580069987.5/2.html,转载请声明来源钻瓜专利网。