[发明专利]一种海量不确定XML近似查询方法有效

专利信息
申请号: 201910644208.X 申请日: 2019-07-17
公开(公告)号: CN110321456B 公开(公告)日: 2021-06-29
发明(设计)人: 刘健;张蕾;龚蕾蕾 申请(专利权)人: 哈尔滨工业大学
主分类号: G06F16/835 分类号: G06F16/835
代理公司: 北京科家知识产权代理事务所(普通合伙) 11427 代理人: 徐思波
地址: 150001 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 海量 不确定 xml 近似 查询 方法
【权利要求书】:

1.一种海量不确定XML近似查询方法,其特征在于:包括以下步骤:

1)、数据表示与存储实现;

2)、数据查询处理实现;

3)、智能化数据查询实现;

所述步骤1)中,在数据表示与存储实现阶段,将主要实现面向海量不确定 XML 的列数据库表示与存储,包括以下步骤:

A、基于列数据库的海量不确定 XML 数据表示模型构建具体过程如下:

a、识别不确定 XML 数据的多粒度不确定性;

b、给出不确定 XML 数据在列数据库中的表示方法和不确定列数据库模型定义;

c、建立基于不确定列数据库的海量不确定 XML 数据表示模型;

B、基于不确定列数据库的海量不确定 XML 数据存储具体实现过程如下:

i)、对于模式已知的海量不确定 XML 数据,将依照如下过程设计其在不确定列数据库的存储模型:

(a)获取不确定 XML 数据库模式中的叶子元素、非叶子元素、属性信息;

(b)以非叶子元素为基本划分单元设计相应列数据库表,依据每个非叶子元素单元内嵌套的叶子元素、属性信息设计相应列;

ii) 对于模式未知的海量不确定 XML 数据,将依照如下过程设计其在不确定列数据库的存储模型:

(a)识别不确定 XML 数据库中的数据实体,抽取不确定 XML 数据树结点路径信息;

(b)以数据实体为基本划分单元设计相应列数据库表,依据每个数据实体单元内对应的数据树路径信息设计列数据库相应列,给出海量不确定 XML 数据库数据实体、路径信息与列数据库列之间的映射规则;

(c) 建立模式未知情况下的不确定 XML 数据库与列数据库之间的映射模型;

iii)对于不确定列数据库中的海量不确定数据,依据如下过程实现不确定列数据库到不确定 XML 数据库的存储转换模型:

(a)依据不确定列数据库中各表的主键和列设计以非叶子结点为根的多棵不确定 XML树;

(b)依据不确定列数据库中数据关联信息对各不确定XML树进行拼接从而生成完整不确定XML树;

所述步骤2)中在查询处理实现阶段,首先将构建不确定 XML XPath/XQuery 查询模型与 MapReduce 查询模型的映射模型,具体过程如下:

i) XPath 查询与 MapReduce 查询的映射模型构建:

(a)识别 XPath 查询轴、路径表达式查询限制条件,设计 XPath 父子轴、祖先后代轴、兄弟轴轴限制条件,以及绝对查询路径和相对查询路径路径查询表达式的 MapReduce 映射转换方法;

(b)建立 XPath 查询与 MapReduce 查询转换模型,并对转换后的查询条件进行拼接,进而生成完整映射查询表达式,在此基础上设计划分查询任务,设计实现面向海量不确定XML 数据的分布式查询方法;

ii) XQuery 查询与 MapReduce 查询的映射模型构建:

(a)识别 XQuery 查询语句,设计 XQuery FLWOR 查询的 For、Let、Where、Order by、Return 语句的MapReduce 映射转换方法;

(b)建立 XQuery 查询与 MapReduce 查询转换模型,并对转换后的查询条件进行拼接,进而生成完整映射查询表达式,在此基础上设计划分查询任务,设计实现面向海量不确定 XML 数据的分布式查询方法;

所述步骤3)中智能化数据查询阶段,将主要实现海量不确定 XML 智能化近似查询模式,近似查询具体实现过程如下:

(a)识别给定查询条件,将给定查询条件分类成数值型内容查询条件、文本型内容查询条件、树型结构查询条件三个类型;

(b)推理用户查询意图,设计查询条件权重评估方法;

(c)设计数值型查询内容、文本型查询内容、树型查询结构的相似度评估方法;

(d)设计自适应查询松弛方法以及 TopK 查询结果排序方法,并给出海量不确定 XML近似查询解决方案。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910644208.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top