[发明专利]一种隐私保护的大数据的近似检索方法在审
申请号: | 201911106252.1 | 申请日: | 2019-11-13 |
公开(公告)号: | CN110866275A | 公开(公告)日: | 2020-03-06 |
发明(设计)人: | 张宏莉;周志刚;张宇;叶麟;于海宁;王星;方滨兴;曾浩华;吕文娟 | 申请(专利权)人: | 哈尔滨工业大学;电子科技大学广东电子信息工程研究院 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/953;G06F16/2458 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 潘俊达;郭宝煊 |
地址: | 150000 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 隐私 保护 数据 近似 检索 方法 | ||
本发明属于信息安全技术领域,具体涉及一种隐私保护的大数据的近似检索方法,包括步骤1、用户提出数据搜索请求,并将该请求提交给搜索引擎;步骤2、搜索引擎接收搜索请求,搜集当前数据平台的状态信息,并对搜索请求的可行性进行预估;步骤3、若预估结果与搜索请求不同,则拒绝该请求;若预估结果与搜索请求一致,则进行实施;步骤4、数据平台将实施结果返回给搜索引擎,并由搜索引擎呈现给用户。与现有技术相比,本发明针对大数据搜索目前尚无“精度、时效、隐私保护粒度”等多维一体的整体性解决方案的问题,实现大数据搜索三大维度相协的数据检索方案,解决了由同构搜索、数据版本更新所带来的重搜索问题,提升通用搜索的检索效率。
技术领域
本发明属于信息安全技术领域,具体涉及一种隐私保护的大数据的近似检索方法。
背景技术
数据检索是最为常见的数据服务,也是对数据进行进一步分析、挖掘等复杂统计操作的基础。从用户的搜索请求看,随着人们生活工作的节奏加快,用户对搜索的期许发生巨大改变,相比枯燥地等待精准的解答,人们更期望得到满足精度需求的快速搜索体验。从大数据本身的特征看,因其往往由多源汇聚而成,期间多含有噪声、冗余等信息,且大数据大多是有限开放的(即由于大数据中可能含有敏感/隐私信息,数据拥有者在对其发布前需对数据信息匿名化处理),因而大数据进行精准统计分析的期望既不现实也无可能。从搜索技术看,传统的搜索引擎技术,主要面向Web1.0静态网页,是基于关键字的“存在性扫描搜索”,不能支持面向Web2.0/3.0应用具有4V特性的大数据及其满足用户快速高精度的搜索请求。这些问题催生了人们对隐私保护的新型快速高精度大数据搜索技术的探索。
目前,对于隐私保护的大数据的搜索主要有两种,分别为针对特定搜索请求,研究相应高效的大数据搜索模式和针对通用的搜索请求,以提高搜索精度/时效、保护数据隐私为目标,研究相应的搜索模式和算法。然而上述两种方法虽然都针对大数据近似搜索的不同需求侧面进行了研究,但彼此之间却由于精度、失效、隐私保护、数据可用性等方面所采用的度量机制不同而无法协同,从而制约了其所提方法在现实应用中的实用性。
有鉴于此,有必要提出一种隐私保护的大数据的近似检索方法,以满足实际的需要。
发明内容
本发明的目的在于:针对现有技术的不足,而提供的一种隐私保护的大数据的近似检索方法,通过该方法,能对隐私保护的大数据实现精度、时效、隐私保护粒度等多维一体的数据检索,提高了检索的效率。
为实现上述目的,本发明采用如下技术方案:
一种隐私保护的大数据的近似检索方法,包括以下步骤:
步骤1、用户提出数据搜索请求,并将该请求提交给搜索引擎;
步骤2、所述搜索引擎接收所述搜索请求,搜集当前数据平台的状态信息,并对所述搜索请求的可行性进行预估;
步骤3、若预估结果与所述搜索请求出现偏差,则拒绝该请求,并反馈用户进行搜索参数修改;若预估结果与所述搜索请求一致,则进行实施;
步骤4、所述数据平台将实施结果返回给所述搜索引擎,并由所述搜索引擎呈现给用户。
作为对本发明中所述的隐私保护的大数据的近似检索方法的改进,所述搜索请求为一个四元组Q(Op,D,ρ,T),其中,Op表示用户对目标数据集合D的搜索操作,ρ为用户设置的搜索精度下限值,T为用户可接受的搜索时效。
作为对本发明中所述的隐私保护的大数据的近似检索方法的改进,在步骤2中,所述搜索引擎先搜集当前数据平台的状态信息,然后通过对操作Op及数据对象D统计信息进行分析,最后再结合数据平台对该用户设定的数据隐私保护粒度,对所述搜索请求Q的可行性进行预估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学;电子科技大学广东电子信息工程研究院,未经哈尔滨工业大学;电子科技大学广东电子信息工程研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911106252.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种LF炉钢包加揭盖装置及其使用方法
- 下一篇:一种远程控制的测控设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置