[发明专利]一种基于多样性XML文档近似查询方法无效

专利信息
申请号: 200710018535.1 申请日: 2007-08-24
公开(公告)号: CN101114291A 公开(公告)日: 2008-01-30
发明(设计)人: 覃征;衡星辰;邵利平;姜山 申请(专利权)人: 西安交通大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 西安通大专利代理有限责任公司 代理人: 陈翠兰
地址: 710049*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 多样性 xml 文档 近似 查询 方法
【说明书】:

技术领域

本发明属于计算机设计与应用技术领域,涉及计算机软件、信息检索技术、半结构化数据处理技术、人工智能技术以及XML描述语言,特别涉及一种基于多样性XML文档的近似查询方法。

背景技术

近年来,随着XML(Extensible Markup Language)的出现,针对XML文档半结构化数据的查询算法的研究逐渐引起了国内外信息检索领域人们的关注。XML文档具有灵活的表达能力,而这种灵活的表达能力使得不同组织和个人建立的XML文档,难以遵照一个统一的数据模式,即使内容完全相同的文档,不同的组织和个人也很难按照统一的标准来建立结构和标识内容完全相同的XML文档,从而造成了XML文档数据的多样性。如何针对WEB上的大量的多样性的XML数据进行有效的信息提取成为了XML数据管理研究的重要课题。

目前,已有的XML查询方法的研究主要关注单DTD下XML文档集的精确查询和近似查询,解决方法主要采用了以树模型匹配作为理论基础的结构化连接算法等相关技术,并取得了较好的查询效果。而当针对多样性XML文档集时,则效果并不理想。

针对基于多样性XML文档的近似查询方法,申请人经过查新,检索到与本发明紧密相关的专利1个,国内文献1篇,国外相关文献1篇:

(一)相关专利(名称、申请人或发明者)1个:

1.专利名称:XML流数据的复杂小枝模式查询匹配方法

专利申请人:复旦大学

(二)国内相关文献(标题、作者或机构、出处)1篇:

1.标题:XML查询中DTD的排序技术

刊名:计算机研究与发展,2003,40(11):1579~1585.

(三)国外相关文献(标题、作者或机构、出处)1篇:

1.Title:Schema-Driven Evaluation of Approximate Tree-Pattern Queries

Author(s):Torsten Schlieder.

Source:8th International Conference on Extending Database Technology,

Prague,Czech Republic,March 25-27,2002:514-532.

对上述文献分析如下:

在专利1中,发明人提出了一种XML流数据的复杂小枝模式查询匹配方法。通过定义的紧凑小枝模式查询树,将复杂的AND/OR谓词作为单独的抽象语法树来处理,同时,将所有小枝模式查询组合成单个可共享公共前缀的查询树,利用提出的基于运行栈的算法,结合自顶向下和自顶向上过程,单遍、高效处理基于XML流的任何复杂小枝查询。

国内文献[1]中,对“候选DTD定位”,“候选DTD与用户查询结构的距离排序”等技术进行了研究。在对候选DTD与用户查询结构的距离进行接近线性时间复杂性的排序运算时,提出了以“树间亚距离排序”代替“树间距离排序”的观点,即以查询结构与查询在候选DTD中的上下文之间的距离,代替查询结构与候选DTD之间的距离参与排序,提高了候选DTD排序的准确性。但文中没有进一步给出排序后的DTD对用户的查询结构进行重构的方法以及结合该DTD排序技术的XML近似查询算法框架。

国外文献[1]中,提出了一种XML近似查询语言-ApproXQL以及基于该语言的近似查询算法。为了获得和查询最近似的K个结果文档,该文从树编辑距离的角度出发,通过对查询表达式进行基于代价的查询变异来评估用户查询和XML文档之间的近似度,最后按XML文档所对应的查询变异代价总和来决定最好的K个查询结果文档。但查询的实现,需要人工设定查询结构中各结点的插入、重命名等变异操作的代价,并且在变异查询数量很多的情况下,求解最优的K个结果文档的效率并不高,另外,该文并没有考虑多DTD下XML文档查询的多样性问题。

发明内容

为了克服上述现有技术存在的缺陷或不足,本发明提供了一种基于多样性XML文档的近似查询方法,能够对多DTD下的XML文档集按照一种统一的方式提出查询,并通过两次查询重写准确地查询出满足用户查询需求XML文档序列,并按近似度高低进行排序。

本发明的技术方案是这样实现的:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710018535.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top