[发明专利]一种层次关系数据上关键字检索结果的聚合摘要方法有效

专利信息
申请号: 201110150869.0 申请日: 2011-06-07
公开(公告)号: CN102214216A 公开(公告)日: 2011-10-12
发明(设计)人: 何震瀛;胡昊;汪卫 申请(专利权)人: 复旦大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海正旦专利代理有限公司 31200 代理人: 陆飞;盛志范
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 层次 关系 数据 关键字 检索 结果 聚合 摘要 方法
【说明书】:

技术领域

发明属于关系数据库技术领域,具体涉及一种层次关系数据上关键字检索结果的聚合摘要方法。

背景技术

近年来,关键字检索作为从结构化或半结构化数据中提取所需信息的方法已被广为接受。目前已有许多针对关键字检索问题提出的检索系统。但基于关系数据库上的检索系统更多致力于获得包含所有关键字的元组或元组连接树。简单的将这些结果返回会造成信息冗余并且有时还会生成无意义的结果。此外,在许多数据库中,具有层次关系的数据普遍存在,这对检索结果信息整合具有指导作用。

对于检索结果的进一步处理等工作包括打分方法和结果聚合已经有许多人在研究了。关系数据库检索结果的聚合问题现有的方法仅关注于一张表上的聚合操作。然而,实际应用中,信息会依据范式被分解成不同的部分存储于多张表中。若简单的将该方法应用于多张表的问题中会根据连接关系生成一张非常大的表,这是耗时且不实际的。另外,该方法中的属性上并无层次关系。需要注意的是,也有另外的工作对聚合操作予以支持,但是,它需要由用户指定在哪些属性上进行聚合操作,这对于不熟悉数据库模式的大多数用户来讲是十分困难的。而且,该工作中的聚合操作是对结果集进行聚合选择(即计算元组数目或求最大最小值等),并非在此基础上做信息整合。摘要问题现有的方法有基于贪心和随机算法的两种解决方案。

发明内容

本发明的目的是针对层次关系数据库关键字检索结果的聚合摘要问题,提出一种基于排序和剪枝的聚合摘要方法,以减少查询代价,提升用户体验。

本发明提出的聚合摘要方法,利用层次关系的性质,结合最低上层最小覆盖聚集的原则以及最大覆盖原理的特征,对带连接元组集进行按序连接,减少连接开销,最后在摘要阶段给出3个剪枝条件,既保证找出的结果是满足贪心法的结果,又大大减小搜索空间,提高摘要效率。

首先对一些基本概念进行定义:

定义1. 划分:设S是一个集合,                                                。如果下列条件成立则称为S的一个划分: ① , ② 对于任意Pi,,若PiPj为空集。

定义2. 聚集关系:设a={S1, S2,… , Sn}是一个有限元组集族元组是某关系数据库中的每一条记录,Si(1≤ i ≤ n)是任意元组集合,≦是如下定义的二元关系:对于a中任意集合SiSj,如果存在一个函数F:→Sj(是Si的划分),则称SiSj满足≦,记作SiSjF称为聚集函数。如果满足下列条件则称为a上的聚集关系:对于a中任意集合SiSj,如果SiSj, SjSi,则Si=Sj

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110150869.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top