[发明专利]基于数据量的查询连接方法有效
申请号: | 201410124531.1 | 申请日: | 2014-03-28 |
公开(公告)号: | CN103927346B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 陈岭;周强 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天勤知识产权代理有限公司33224 | 代理人: | 胡红娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据量 查询 连接 方法 | ||
1.一种基于数据量的查询连接方法,其特征在于,包括:
步骤1,向元数据服务器提交查询请求,获取参与连接的各表所对应的统计信息;
步骤2,根据获取到的统计信息估算得到当前执行计划中所有表的数据量;
步骤3,重复步骤1及步骤2,直至遍历执行计划的搜索空间,找出具有合适数据量使得查询代价最小的执行计划,按该执行计划中的连接顺序进行表的连接。
2.如权利要求1所述基于数据量的查询连接方法,其特征在于,其中,元数据服务器构建方式为,选取关系型数据库并设计列级别的表模式,根据设计好的表模式在相应的关系型数据库中创建元数据库及表关系,构建元数据服务器。
3.如权利要求1所述基于数据量的查询连接方法,其特征在于,元数据服务器中存储的统计信息为每张表所对应的统计信息,所述统计信息根据设计的表模式对表进行统计得到。
4.如权利要求1所述基于数据量的查询连接方法,其特征在于,所述关系型数据库为:MYSQL数据库,Derby数据库或Oracle数据库。
5.如权利要求1所述基于数据量的查询连接方法,其特征在于,统计信息包括:列名、列中数据值的下界、列中数据值的上界、表中列数据为空的数量、表中列数据不同值的数量、列中字段数据的平均数据量以及列中字段数据的最大数据量、表或视图的总行数。
6.如权利要求1所述基于数据量的查询连接方法,其特征在于,其中,元数据服务器以及统计信息在元数据服务器中的存储均在离线状态下完成。
7.如权利要求1所述基于数据量的查询连接方法,其特征在于,在步骤2中,每个表的数据量根据该表所对应的选择度、字段平均数据量和表的总行数计算得到。
8.如权利要求7所述基于数据量的查询连接方法,其特征在于,选择度的估算方法为,根据查询中的查询条件及统计信息进行相应计算,得到表中满足查询条件的行在所要查询的对象集合中所占的比例。
9.如权利要求8所述基于数据量的查询连接方法,其特征在于,每张表数据量size的计算公式如下:
selectivity表示查询的选择度,numsOfTableLine为表或视图的总行数,avgColSizei表示需要返回的表中第i列字段的平均数据量,j为表的列数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410124531.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:交互式搜索及推荐方法和装置
- 下一篇:一种数据集成方法