[发明专利]基于双阈值的分布式Top‑|K|查询方法有效
申请号: | 201410175464.6 | 申请日: | 2014-04-28 |
公开(公告)号: | CN103984707B | 公开(公告)日: | 2017-04-05 |
发明(设计)人: | 李国瑞;王颖 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 刘萍 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于双阈值的分布式Top‑|K|查询方法。整个方案包括了三个阶段双阈值计算阶段、候选集计算阶段、Top‑|K|查询阶段。本发明涉及一种分布式网络环境中查询绝对值最大的前K项元素聚合值(聚合函数的计算结果,如所有元素值的和)的方法,具体是一种通过部分已知数据构建分布式系统中元素聚合值的正、负阈值,从而在有限次交互过程中实现对绝对值最大的前K项元素聚合值进行查询的方法,可以应用于互联网、物联网等分布式系统中元素聚合值的Top‑|K|项查询。本发明能够大大节省数据传输量,降低查询时延。 | ||
搜索关键词: | 基于 阈值 分布式 top 查询 方法 | ||
【主权项】:
一种基于双阈值的分布式Top‑|K|查询方法,其特征在于,整个方案包括了三个阶段:双阈值计算阶段、候选集计算阶段、Top‑|K|查询阶段;分布式系统由m个节点构成,其中包括一个管理节点和多个成员节点,每个节点中包含一个由若干对(索引,值)构成并按值降序排列的元素列表Lj={(i,vj(i)),i=1,…nj},其中nj为该节点中包含元素的个数;管理节点遵循与成员节点相同的元素选取规则;定义全部元素和部分元素和全部元素和上界全部元素和下界其中:上述公式中vj(i)已知表示第j个节点中索引为i的元素在当前元素选取范围内,对于成员节点来说,该元素的值已由成员节点发送至管理节点;对于管理节点来说,该元素的值符合当前元素选取规则即在双阈值计算阶段中元素属于前K个正元素与后K个负元素集合,在候选集计算阶段中元素值属于大于等于的正元素或小于等于T的负元素集合,在Top‑|K|查询阶段中元素索引属于候选集S;因此,vj(i)直接用于计算元素i的部分元素和、全部元素和上界或全部元素和下界;与之相对应,vj(i)未知表示第j个节点中索引为i的元素不在当前元素选取范围内,对于成员节点来说,该元素的值没有从成员节点发送至管理节点;对于管理节点来说,该元素的值不符合当前元素选取规则;因此,vj(i)无法用于计算元素i的部分元素和、全部元素和上界或全部元素和下界,分别需要用0、正阈值或负阈值T来代替;双阈值计算阶段包括以下具体步骤:1)成员节点向管理节点发送前K个正元素与后K个负元素集合;2)管理节点计算所有接收元素的部分和;3)管理节点计算前K个正元素和下界并赋值给4)管理节点计算后K个负元素和上界并赋值给τ1;5)管理节点计算正阈值与负阈值T=τ1/m;6)管理节点向所有成员节点发送正阈值与负阈值T;候选集计算阶段包括以下具体步骤:7)成员节点向管理节点发送所有未发送过的大于等于的正元素或小于等于T的负元素集合;8)管理节点计算所有接收元素的部分和;9)管理节点计算前K个正元素部分和的下界并赋值给10)管理节点计算后K个负元素部分和的上界并赋值给τ2;11)管理节点计算所有接收元素的全部和上界;12)管理节点计算所有接收元素的全部和下界;13)管理节点构建候选集14)管理节点向所有成员节点发送候选集S;Top‑|K|查询阶段包括以下具体步骤:15)成员节点向管理节点发送候选集S中所有未发送过的元素集合;16)管理节点计算候选集S中所有元素的全部和;17)管理节点选取候选集S中绝对值最大的前K个元素。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410175464.6/,转载请声明来源钻瓜专利网。