[发明专利]记录的列状存储表示有效
申请号: | 201710015074.6 | 申请日: | 2011-04-04 |
公开(公告)号: | CN107092627B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | A·古巴雷夫;S·梅尔尼克;J·J·隆;G·M·罗梅尔;N·施瓦屈玛尔;M·B·托尔顿;T·瓦西拉基斯 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/242;G06F16/2458;G06F16/36;G06F40/30;G06F40/20;G06F40/40 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 记录 存储 表示 | ||
1.一种计算机实现的方法,包括:
由计算系统访问存储在计算机存储器中的数据记录集合,所述数据记录集合中的至少一些记录包括多个数据值以及标识出来自所述多个数据值的对应数据值的语义的多个数据元素,所述数据记录集合中的一个或多个数据记录中的每个包括相同数据元素的多个实例,并且包括对应于所述相同数据元素的所述多个实例的数据值;
由所述计算系统生成列状条带集合,所述列状条带集合包括来自所述数据记录集合中的数据记录的所述数据值,所述列状条带集合中的每个列状条带包括对应于来自所述记录集合中的记录的具体数据元素的数据值;
由所述计算系统针对所述列状条带集合中每个列状条带中的所述数据值中的至少一些生成以下数据:所述数据标识出来自所述数据记录集合的相应数据记录中的相应数据值的位置。
2.根据权利要求1所述的方法,其中所述数据由重复值和定义值所构成。
3.根据权利要求1至2中任一项所述的方法,进一步包括根据(i)所述列状条带集合中的所述列状条带,和(ii)所述数据来重构仅包含来自所述数据记录集合中的所述记录的数据元素的子集的记录集合。
4.根据权利要求1至2中任一项所述的方法,进一步包括生成所述列状条带集合中至少一些特定数据值的重复值,以与所述列状条带集合中的所述数据值一起存储,
其中每个特定数据元素的路径包括对所述特定数据元素的任意一个或多个父数据元素;
其中每个特定数据值的所述重复值标识出对应于所述特定数据值的所述特定数据元素的所述路径中最近重复过的数据元素;
其中所述特定数据元素的所述路径中的所述最近重复过的数据元素是在包括所述特定数据值的特定数据记录的分析期间在所述特定数据元素的所述路径中第二次遇到的数据元素,所述分析从所述特定数据值在所述特定数据记录中的位置向上朝着所述特定数据记录的开始进行。
5.根据权利要求1至2中任一项所述的方法,其中所述数据元素集合中所包括的所述数据元素中的每个特定数据元素与包括对所述特定数据元素的任意一个或多个父数据元素的相应路径相关联;
进一步包括生成所述数据记录集合中的至少一些特定路径或所述特定路径的部分的定义值,以与所述列状条带中的所述数据值一起存储;
其中所述至少一些特定路径或所述特定路径的部分的定义级别标识出所述特定路径或路径的部分中所包括的数据元素的数量。
6.根据权利要求1至2中任一项所述的方法,进一步包括:
由所述计算系统从数据源集合接收信息,每个数据源包括未根据模式而结构化的信息;以及
由所述计算系统通过根据所述模式对至少一些所述数据源中的所述信息进行结构化而生成所述数据记录集合中的至少一些所述数据记录。
7.根据权利要求1至2中任一项所述的方法,进一步包括:
由所述计算系统执行对所述列状条带集合的查询;以及
由所述计算系统且响应于所述查询的执行而输出新的列状条带,所述新的列状条带包括来自由所述查询所标识出的所述列状条带集合的列状条带的值的子集。
8.根据权利要求7所述的方法,其中执行所述列状条带集合的所述查询而并不将所述列状条带集合中所包括的所述数据值加载到数据库中。
9.根据权利要求1至2中任一项所述的方法,其中所述列状条带集合的至少第一列状条带包括多个数据块,所述多个数据块中的至少一些数据块中的每个包括定义了在每个块的值中所找到的值类型的声明值,从而使得在执行所述第一列状条带的查询时,所述计算系统避免不包括由所述查询所指定的数据值的一个或多个数据块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710015074.6/1.html,转载请声明来源钻瓜专利网。