[发明专利]一种基于二维空间的数据查询方法在审
申请号: | 202210794577.9 | 申请日: | 2022-07-07 |
公开(公告)号: | CN115292362A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 谢珉;王尧舒 | 申请(专利权)人: | 深圳计算科学研究院 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/26;G06F16/2457;G06F16/22 |
代理公司: | 深圳市智胜联合知识产权代理有限公司 44368 | 代理人: | 袁斌 |
地址: | 518000 广东省深圳市龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二维 空间 数据 查询 方法 | ||
本申请提供了一种基于二维空间的数据查询方法,通过获取数据库中的若干数据点,并依据预设规则和若干所述数据点生成凸包;依据用户输入的后悔指数确定缩小比例,并依据所述缩小比例确定若干所述数据点对应于所述凸包的最大可视区域;依据若干所述数据点的最大可视区域确定结果集合,其中,所述结果集合的可视区域包围所述凸包;依据所述结果集合确定包含最少所述数据点的最简集合。通过预构建凸包,使得用户每次在同一个数据集上调用不同的k‑regret查询时,不需要重建凸包,大大提高查询效率。通过以链表的方式顺时针存储极点,可以快速地计算每个数据点的可视区域。
技术领域
本申请涉及数据查询领域,特别是一种基于二维空间的数据查询方法。
背景技术
近年来,数据库规模日益庞大。一个数据库中,往往存储着成千上万的产品。然而,用户在实际访问数据库的时候,并不是对数据库里所有产品都感兴趣。相反,他们只致力于在数据库中获取符合他们需求的少量产品。由于数据库的产品数量庞大,我们不可能要求用户遍历整个数据库去定位他们感兴趣的产品。因此,我们需要在现代化数据库中,提供便捷的查询方法,既不需要用户花费大量的精力遍历数据,也能尽可能准确地找到用户感兴趣的产品。
这个问题的难点在于,用户的需求复杂多样,而大多数用户并不能准确地对他的需求进行描述。举例来说,假设用户A访问了一个二手车数据库,每辆二手车都会由多个属性描述,比如,价格、马力、已使用年限和里程等等。用户A想在数据库中选择一辆不贵但是相对较新的二手车。换言之,用户只关心车的价格属性和年限属性,不太关心马力等属性。因为用户只关心两个属性,这样的问题被描述为二维空间下的查询问题。然而,即便用户只关心价格和年限两个属性,对于二手车的价格和年限,不同用户的侧重可能不同。有的用户希望价格越便宜越好,而有的用户愿意花更多的钱去买一辆较新的车。用户在两个属性间的侧重权衡,往往抽象地存在于用户的脑子里。数据库系统不能够得到用户偏好的精准描述,从而很难在二维空间的数据库中,准确地找到用户的感兴趣的产品。
为了在二维空间的数据库中,准确地找到用户的感兴趣的产品。学者们曾提出过多种数据库的查询方式。传统的查询包括:top-k查询和skyline查询。对于top-k查询来说,用户需要明确的表明他们的偏好。比如在上述二手车数据库库中,价格和年限是用户关心的两个属性,用户需要明确的标示价格在他们的偏好中占比40%,年限在他们的偏好中占比60%。基于这个具体偏好,数据库可以计算出所有二手车的具体得分。通过对得分进行排序,得分最高的前k个二手车将作为输出返回给用户。它的缺点就是需要用户在使用时,必须明确地给出他们的偏好,即每个属性在他们的侧重中,各占比多少。这样的要求非常严苛,非常少用户在实际使用中,能清晰地给出他们的偏好,有的甚至用户自己都不能准确描述他们自己的偏好。
与之相对的,skyline查询不需要用户表明任何偏好,它利用了一个叫做“支配”的概念,从数据库中获取产品返回给用户。具体来说,如果一辆车p在所有属性上都比另一辆车q要好,那么我们就说p支配了q。比如车p既比车q便宜又比它新,那p就支配了q。对于只关心二手车价格和年限的用户A来说,他显然喜欢车p多于车q。在skyline查询中,不被任何其他任何产品支配的产品,就会被作为结果返回。但它的缺点就是庞大的输出大小。虽然在skyline查询中,他们利用了“支配”的概念,排除了数据库中被其他产品支配的产品。但对于余下产品,skyline查询并没有能进一步筛选的机制,将会全部返回给用户。因此,在“支配”概念完全无法排除产品的最坏情况下,skyline查询可能会将整个数据库返回给用户,达不到帮助用户准确地找到感兴趣的产品的目的。
发明内容
鉴于所述问题,提出了本申请以便提供克服所述问题或者至少部分地解决所述问题的一种基于二维空间的数据查询方法,包括:
一种基于二维空间的数据查询方法,所述方法用于从满足用户给定的后悔指数的若干结果集合中查询出最简的集合,所述方法包括:
获取数据库中的若干数据点,并依据预设规则和若干所述数据点生成凸包;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳计算科学研究院,未经深圳计算科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210794577.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置