[发明专利]用于管理异构非结构化数据的关系型数据库及其创建和查询非结构化数据描述信息的方法无效

专利信息
申请号: 201210594095.5 申请日: 2012-12-29
公开(公告)号: CN103034738A 公开(公告)日: 2013-04-10
发明(设计)人: 武新;范振勇;张学;崔维力;赵伟 申请(专利权)人: 天津南大通用数据技术有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 天津滨海科纬知识产权代理有限公司 12211 代理人: 孙春玲
地址: 300384 天津市滨海新区高新区*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 管理 异构非 结构 数据 关系 数据库 及其 创建 查询 描述 信息 方法
【说明书】:

技术领域

发明属于数据存储领域,尤其是一种涉及用于管理外部异构数据的关系型数据库及创建和查询方法。

背景技术

“大数据”(Big data),简而言之,即从各种各样的海量数据中,快速获信息的能力,就是大数据技术,大数据通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

现有的关系型数据库中经常使用BLOB、TEXT等字段无法满足对大数据的支持,关系型数据库ORACLE和MS SQL Server都有存储在数据库外的BLOB类型字段,在ORACEL中是BFILE,MS SQL Server是FileStream,它们的特点都是在数据库中存放数据的文件名,数据库通过文件名读取存放在磁盘上的数据。缺点是必须通过外部应用保证数据的完整性以及与数据库其他字段的一致性,而数据库本身没有相应的约束能力。同时,外部存储支持的协议单一,无法支持多种远程存储,并适应各种层出不穷分布式存储协议。

发明内容

本发明要解决的问题是提供一种用于管理外部异构数据的关系型数据库,尤其适合于多种外部数据存储于多种系统。

为解决上述技术问题,本发明采用的技术方案是:

一种用于管理外部异构数据的关系型数据库,所述的关系型数据库包括用以描述存储在数据库外部的异构数据的格式化文本。

进一步的,所述的格式化文本包括提供数据的访问协议和存储位置的URI字符串。

进一步的,所述的格式化文本包括用于提供数据的访问协议和存储位置的URI字符串。

进一步的,所述的格式化文本包括数据校验属性字段。

进一步的,所述的数据校验字段包括数据长度、数据最后修改时间、数据的MD5或以上三种的任意组合。

进一步的,所述的格式化文本包括数据格式字段。

进一步的,所述的数据格式字段包括媒体类型和编码算法或以上两种组合。

本发明还提供了一种针对上述用于管理外部异构数据的关系型数据库创建方法,包括:

将异构数据保存在存储层;

创建异构的可描述的格式化文本;

将可描述的格式化文本储到数据库中。

进一步的,所述的方法第二步还包括:将统计的异构数据的数据校验属性存入格式化文本。

进一步的,所述的方法第二步还包括:将统计的异构数据的数据属性存入格式化文本。

根据本发明的另一方面,还提供了一种针对持大数据的数据库对外部数据的查询方法,包括:

数据库收到查询请求;

数据库向查询请求返回描述外部数据库的格式化文本;

格式化文本被解析;

通过解析的格式化文本通过存储层读取数据。

本发明具有的优点和积极效果是:由于采用上述技术方案,使得数据库具有高拓展性,能够适应外部数据的多种访问协议,同时也增强了数据库外部管理的完整性和外部数据指向的数据独立性。

附图说明

图1是本发明的一个实施例中数据库实现读取URI数据的示意图

图2是本发明的一个实施例数据库创建的方法示意图

图3是本发明的一个实施例中数据库进行查询的一种模式的示意图

图4是本发明的一个实施例中数据库进行查询的另一种模式的示意图

具体实施方式

下面结合本发明的一个实施例对本发明作进一步的阐述,GBase8a作为一种支持大数据的数据库,数据保存在GBase8a的外部,其访问协议可以是本地文件、也可以是存放在Http服务器、Ftp服务器以及其他专用协议存储的数据。

通用资源标志符(URI)可以对多种数据类型进行定位,GBase8a中的可描述性格式化文本包括了URI字符串,该URI字符串就是通过简单的格式化文本,能够存储外部数据的URI。

URI字符串通过为varchar类型增加URI标识来实现的,其数据为多行文本,行与行间以一对回车符和换行符分隔,包括:

首行的URI

URI=协议名称″:″认证信息目录文件名[″?″查询参数][″#″书签]

仅支持绝对URI,不支持相对地址。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津南大通用数据技术有限公司,未经天津南大通用数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210594095.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top