[发明专利]一种层次关系数据上关键字检索结果的聚合摘要方法有效
| 申请号: | 201110150869.0 | 申请日: | 2011-06-07 |
| 公开(公告)号: | CN102214216A | 公开(公告)日: | 2011-10-12 |
| 发明(设计)人: | 何震瀛;胡昊;汪卫 | 申请(专利权)人: | 复旦大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;盛志范 |
| 地址: | 200433 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 层次 关系 数据 关键字 检索 结果 聚合 摘要 方法 | ||
技术领域
本发明属于关系数据库技术领域,具体涉及一种层次关系数据上关键字检索结果的聚合摘要方法。
背景技术
近年来,关键字检索作为从结构化或半结构化数据中提取所需信息的方法已被广为接受。目前已有许多针对关键字检索问题提出的检索系统。但基于关系数据库上的检索系统更多致力于获得包含所有关键字的元组或元组连接树。简单的将这些结果返回会造成信息冗余并且有时还会生成无意义的结果。此外,在许多数据库中,具有层次关系的数据普遍存在,这对检索结果信息整合具有指导作用。
对于检索结果的进一步处理等工作包括打分方法和结果聚合已经有许多人在研究了。关系数据库检索结果的聚合问题现有的方法仅关注于一张表上的聚合操作。然而,实际应用中,信息会依据范式被分解成不同的部分存储于多张表中。若简单的将该方法应用于多张表的问题中会根据连接关系生成一张非常大的表,这是耗时且不实际的。另外,该方法中的属性上并无层次关系。需要注意的是,也有另外的工作对聚合操作予以支持,但是,它需要由用户指定在哪些属性上进行聚合操作,这对于不熟悉数据库模式的大多数用户来讲是十分困难的。而且,该工作中的聚合操作是对结果集进行聚合选择(即计算元组数目或求最大最小值等),并非在此基础上做信息整合。摘要问题现有的方法有基于贪心和随机算法的两种解决方案。
发明内容
本发明的目的是针对层次关系数据库关键字检索结果的聚合摘要问题,提出一种基于排序和剪枝的聚合摘要方法,以减少查询代价,提升用户体验。
本发明提出的聚合摘要方法,利用层次关系的性质,结合最低上层最小覆盖聚集的原则以及最大覆盖原理的特征,对带连接元组集进行按序连接,减少连接开销,最后在摘要阶段给出3个剪枝条件,既保证找出的结果是满足贪心法的结果,又大大减小搜索空间,提高摘要效率。
首先对一些基本概念进行定义:
定义1. 划分:设S是一个集合, 。如果下列条件成立则称为S的一个划分: ① , ② 对于任意Pi,,若,则PiPj为空集。
定义2. 聚集关系:设a={S1, S2,… , Sn}是一个有限元组集族,元组是某关系数据库中的每一条记录,Si(1≤ i ≤ n)是任意元组集合,≦是如下定义的二元关系:对于a中任意集合Si和Sj,如果存在一个函数F:→Sj(是Si的划分),则称Si和Sj满足≦,记作Si≦Sj,F称为聚集函数。如果满足下列条件则称为a上的聚集关系:对于a中任意集合Si和Sj,如果Si≦Sj, Sj≦Si,则Si=Sj。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110150869.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高炉渣铁沟盖板
- 下一篇:一种用于裁床的V形剪角装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





