[发明专利]一种基于二维空间的数据查询方法在审

专利信息
申请号: 202210794577.9 申请日: 2022-07-07
公开(公告)号: CN115292362A 公开(公告)日: 2022-11-04
发明(设计)人: 谢珉;王尧舒 申请(专利权)人: 深圳计算科学研究院
主分类号: G06F16/2455 分类号: G06F16/2455;G06F16/26;G06F16/2457;G06F16/22
代理公司: 深圳市智胜联合知识产权代理有限公司 44368 代理人: 袁斌
地址: 518000 广东省深圳市龙*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 二维 空间 数据 查询 方法
【说明书】:

本申请提供了一种基于二维空间的数据查询方法,通过获取数据库中的若干数据点,并依据预设规则和若干所述数据点生成凸包;依据用户输入的后悔指数确定缩小比例,并依据所述缩小比例确定若干所述数据点对应于所述凸包的最大可视区域;依据若干所述数据点的最大可视区域确定结果集合,其中,所述结果集合的可视区域包围所述凸包;依据所述结果集合确定包含最少所述数据点的最简集合。通过预构建凸包,使得用户每次在同一个数据集上调用不同的k‑regret查询时,不需要重建凸包,大大提高查询效率。通过以链表的方式顺时针存储极点,可以快速地计算每个数据点的可视区域。

技术领域

本申请涉及数据查询领域,特别是一种基于二维空间的数据查询方法。

背景技术

近年来,数据库规模日益庞大。一个数据库中,往往存储着成千上万的产品。然而,用户在实际访问数据库的时候,并不是对数据库里所有产品都感兴趣。相反,他们只致力于在数据库中获取符合他们需求的少量产品。由于数据库的产品数量庞大,我们不可能要求用户遍历整个数据库去定位他们感兴趣的产品。因此,我们需要在现代化数据库中,提供便捷的查询方法,既不需要用户花费大量的精力遍历数据,也能尽可能准确地找到用户感兴趣的产品。

这个问题的难点在于,用户的需求复杂多样,而大多数用户并不能准确地对他的需求进行描述。举例来说,假设用户A访问了一个二手车数据库,每辆二手车都会由多个属性描述,比如,价格、马力、已使用年限和里程等等。用户A想在数据库中选择一辆不贵但是相对较新的二手车。换言之,用户只关心车的价格属性和年限属性,不太关心马力等属性。因为用户只关心两个属性,这样的问题被描述为二维空间下的查询问题。然而,即便用户只关心价格和年限两个属性,对于二手车的价格和年限,不同用户的侧重可能不同。有的用户希望价格越便宜越好,而有的用户愿意花更多的钱去买一辆较新的车。用户在两个属性间的侧重权衡,往往抽象地存在于用户的脑子里。数据库系统不能够得到用户偏好的精准描述,从而很难在二维空间的数据库中,准确地找到用户的感兴趣的产品。

为了在二维空间的数据库中,准确地找到用户的感兴趣的产品。学者们曾提出过多种数据库的查询方式。传统的查询包括:top-k查询和skyline查询。对于top-k查询来说,用户需要明确的表明他们的偏好。比如在上述二手车数据库库中,价格和年限是用户关心的两个属性,用户需要明确的标示价格在他们的偏好中占比40%,年限在他们的偏好中占比60%。基于这个具体偏好,数据库可以计算出所有二手车的具体得分。通过对得分进行排序,得分最高的前k个二手车将作为输出返回给用户。它的缺点就是需要用户在使用时,必须明确地给出他们的偏好,即每个属性在他们的侧重中,各占比多少。这样的要求非常严苛,非常少用户在实际使用中,能清晰地给出他们的偏好,有的甚至用户自己都不能准确描述他们自己的偏好。

与之相对的,skyline查询不需要用户表明任何偏好,它利用了一个叫做“支配”的概念,从数据库中获取产品返回给用户。具体来说,如果一辆车p在所有属性上都比另一辆车q要好,那么我们就说p支配了q。比如车p既比车q便宜又比它新,那p就支配了q。对于只关心二手车价格和年限的用户A来说,他显然喜欢车p多于车q。在skyline查询中,不被任何其他任何产品支配的产品,就会被作为结果返回。但它的缺点就是庞大的输出大小。虽然在skyline查询中,他们利用了“支配”的概念,排除了数据库中被其他产品支配的产品。但对于余下产品,skyline查询并没有能进一步筛选的机制,将会全部返回给用户。因此,在“支配”概念完全无法排除产品的最坏情况下,skyline查询可能会将整个数据库返回给用户,达不到帮助用户准确地找到感兴趣的产品的目的。

发明内容

鉴于所述问题,提出了本申请以便提供克服所述问题或者至少部分地解决所述问题的一种基于二维空间的数据查询方法,包括:

一种基于二维空间的数据查询方法,所述方法用于从满足用户给定的后悔指数的若干结果集合中查询出最简的集合,所述方法包括:

获取数据库中的若干数据点,并依据预设规则和若干所述数据点生成凸包;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳计算科学研究院,未经深圳计算科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210794577.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top