[发明专利]一种适用于多种大数据管理系统的交互式查询方法有效
申请号: | 201710515380.6 | 申请日: | 2017-06-29 |
公开(公告)号: | CN107515887B | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 沈志宏;李跃鹏;黎建辉 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 多种 数据管理 系统 交互式 查询 方法 | ||
1.一种适用于多种大数据管理系统的交互式查询方法,其步骤包括:
1)建立关联文档模型,其包括文档集与关联集,所述关联集是文档之间的关联构成的集合;
2)将不同的原始数据模型转换为关联文档模型,通过关联文档模型将不同的数据源连接为一体;
3)基于关联文档模型,建立适合于多元数据的统一查询语言;
4)利用适合于多元数据的统一查询语言,实现对关系型数据库、图数据库以及文件系统的统一查询;
所述关联文档模型的文档集中的文档是一组属性构成的集合,所述属性是同一种类型数据构成的集合;每个文档默认包含一个主码属性,所述主码属性是全局的唯一标识;所述文档集与关联集拥有一个名称标识符来说明集合中文档和关联的语义;
所述适合于多元数据管理系统的统一查询语言包括FIND、WITH、WHERE、RETURN四个子句;FIND语句确定查询的基本变量,这些变量必须代表文档;WITH语句确定在匹配条件语法中使用的中间变量;WHERE语句确定返回结果需要满足的条件;RETURN语句包含了需要返回给用户的数据引用;
FIND语句中的基本查询空间由一类文档或多类文档构成,并且要求关联文档模型不能进行无关联的两类文档之间的比较;WITH语句中隐式的定义了将基本查询空间中的文档以及关联进行的拓展;WHERE语句中不仅能够隐式地定义拓展查询空间的文档、关联,还能进行关联文档中间模型的选择运算;RETURN语句中包含文档、链接、属性层次的URL,或者代表URL的变量,该语句主要执行关联文档模型的投影运算,返回的结果是一个关联文档;
通过所述关联文档模型将不同的数据源连接为一体,形成一个网络,并使用类似URL的形式形成所述统一查询语言的数据引用语法,来统一访问网络中的数据;URL的形式如下:
datasource.document.link.identity.propertyName
其中,datasource表示数据源,document表示数据源向关联文档模型映射的文档,link表示数据源向关联文档模型映射的关联,identity表示文档的主码,propertyName表示文档的属性名。
2.如权利要求1所述的方法,其特征在于,所述统一查询语言的执行过程分为四步:确定文档、建立文档之间关系、选择、投影。
3.如权利要求1所述的方法,其特征在于,所述统一查询语言中的中间变量代表与基本搜索空间相关的文档集合、数值、字符串,中间变量在匹配语法中使用,根据中间变量的类型进行相应的条件匹配操作。
4.如权利要求1所述的方法,其特征在于,所述统一查询语言中的匹配条件是一个由WHERE语句引导的返回值为bool类型的表达式,表达式的语法规则如下:
1)文档集合A,B的聚合筛选:(文档A.link|文档A)=文档B;
2)文档集合筛选:(文档.attribute|关联.attribute)operator基本数据类型;
3)表达式AND|OR表达式。
5.如权利要求1所述的方法,其特征在于,所述统一查询语言中的解析程序包括:整个语法结构相关类,语法树抽象类和接口,语法树具体类。
6.如权利要求1所述的方法,其特征在于,在实际应用中针对所述统一查询语言开发数据库系统的SDK,并在本地数据库查询语言基础上进行一些补偿运算,然后客户端程序通过调用SDK中的API来使用所述统一查询语言操作数据库;或者对数据库直接基于所述统一查询语言设计通信协议,客户端程序通过发送网络请求得到需要的查询结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710515380.6/1.html,转载请声明来源钻瓜专利网。