[发明专利]一种基于多样性XML文档近似查询方法无效

专利信息
申请号: 200710018535.1 申请日: 2007-08-24
公开(公告)号: CN101114291A 公开(公告)日: 2008-01-30
发明(设计)人: 覃征;衡星辰;邵利平;姜山 申请(专利权)人: 西安交通大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 西安通大专利代理有限责任公司 代理人: 陈翠兰
地址: 710049*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 多样性 xml 文档 近似 查询 方法
【权利要求书】:

1.一种基于多样性XML文档近似查询方法,其特征在于:该方法包括XML文档多样性处理,单DTD下XML文档近似查询,查询代价评估和Top-K问题求解四个部分;

XML文档多样性处理模块采用基于PTO模型的映射规则自动生成算法将用户在全局查询模式下提出的原始查询重写为不同DTD下的重写查询树;单DTD下XML文档近似查询模块利用重写查询树,结合基本变异操作,通过对变异查询树的多次精确嵌入实现了单DTD下XML文档集的近似查询;查询代价评估模块采用基于XML样本数据分布统计的方法,计算了每一个查询结果的查询代价;Top-K问题求解模块通过对结点进行区间编码,并借助最优变异查询树的预先估计,最终实现了对多样性XML文档近似查询的Top-K求解。

2.根据权利要求1所述的一种基于多样性XML文档近似查询方法,其特征在于,XML文档多样性处理模块的实现步骤如下:

1)依据基于本体的全局查询模式,按照面向对象查询语言提出原始查询;

2)依据PTO模型:(v1,v2)->c1.role,c2.inverse(role)|c3.attribute,按如下步骤建立DTD和全局查询模式之间的映射规则集:

(1)广度优先遍历DTD树TDTD,抽取TDTD中每条有向边对应的结点v1和v2,若已遍历结束,转步(4);否则,转步(2);

(2)查找v1和v2在全局查询模式图G中对应的概念结点v1和v2或属性attribute,若找到,转步(3);否则,把二元组(v1,v2)加入集合Set1中,转步(1);

(3)如果找到的是两个概念结点c1和c2,则生成规则:(v1,v2)->c’1.role,c’2.inverse(role),转步(1);如果找到的是一个概念结点c1和属性attribute,则生成规则:(v1,v2)->c1.attribute,转步(1);

(4)对Set1集合中的二元组使用规则:(x,y),(y,z)|-(x,z)进行扩展,将新生成的扩展二元组放入集合Set2

(5)遍历集合Set2,抽取其中每一个元组中的结点v1和v2;若已遍历结束,则终止算法;否则,转步(6);

(6)查找v1和v2在全局查询模式图G中对应的概念结点c1和c2或属性attribute,若找到,转步(7);否则,转步(5);

(7)如果找到的是两个概念结点c1和c2,生成规则:(v1,v2)->c’1.role,c’2.inverse(role)转步(5);如果找到的是一个概念结点c1和属性attribute,生成规则:(v1,v2)->c1.attribute转步(5);

3)利用生成的映射规则集按模式路径,概念和角色逐一映射的方式将原始查询改写为不同DTD下的结构谓词集,并由结构谓词集进一步构成为重写查询树形式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710018535.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top