[发明专利]一种基于Skyline的数据泛化方法有效
申请号: | 201710339575.X | 申请日: | 2017-05-15 |
公开(公告)号: | CN107194278B | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 丁晓锋;金海;王丽 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 42201 华中科技大学专利中心 | 代理人: | 廖盈春;李智<国际申请>=<国际公布>= |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 skyline 数据 泛化 方法 | ||
本发明公开了一种基于Skyline的数据泛化方法,包括:根据数据发布隐私保护标准10‑匿名对数据表处理得到策略的再识别的风险量R记为阈值T,并根据准标识符属性的值域和阈值T确定策略空间{S,(R,U)},{S,(R,U)}包括的策略的R值不大于阈值T;对策略空间{S,(R,U)}采用ε‑近似Skyline进行过滤得到候选策略空间{G,(R,U)};对候选策略空间{G,(R,U)}作Skyline计算,得到推荐的策略空间{F,(R,U)},{F,(R,U)}是为数据表推荐的隐私策略空间。本发明通过枚举全策略空间提高了隐私保护策略推荐的准确性,对RU空间的覆盖范围广,满足用户的多层次需求。设定阈值T过滤了隐私保护不达要求的策略,降低了策略空间生成的时间,采用ε‑近似‑Skyline过滤进一步降低了候选策略空间的规模。
技术领域
本发明属于隐私保护的数据发布领域,更具体地,涉及一种基于Skyline的数据泛化方法。
背景技术
数字信息时代,各个群体间(例如:政府,企业,个人等)交换和发布数据变得越来越重要。例如,加州的医院一般需要提交一些针对某些康复病人的医疗数据。这些数据包含一些敏感信息,直接发布将泄露个人隐私。L.Sweeney提到的“连接攻击”的例子。通过属性(Age,Sex,Zipcode)连接病人信息表和选民信息表可以确定姓名为Ahmed患了流感。患者的隐私遭到了泄露。这种数据发布方式是不安全的。因此保护隐私的数据发布被提出。它要求保护隐私的同时最大化数据的可用性。
为了保护发布数据的隐私,两种隐私保护模型被提出。一种是控制再识别的风险量,例如,K-匿名。另一种是基于规则的策略,例如安全港协议(Safe Harbor)。K-匿名是通过泛化、置换和扰动的方式使得同一等价类,其中,同一等价类为具有相同准标识符的记录集合。准标识符虽然本身不能识别个人敏感信息但是和连接另一张包含有标识属性的数据表可以识别个人敏感信息。至少有K个记录。但是,它提供的策略对RU空间覆盖范围很小,不能满足用户多层次的需求,其中,R为风险量,U为信息损失量。健康保险携带和责任法(Health Insurance Portability and Accountability Act,HIPAA)提出的Safe Harbor,要求去除数据表中规定的属性,例如:姓名、电话号码、Email地址等。但是,大多数情况SafeHarbor策略在风险量和信息损失量两个方面表现都较差。
隐私保护和数据使用性的平衡越来越受到人们的追求。为满足用户的多层次需求,筛选出较好的隐私策略变得越来越重要。为防止敏感信息再次被识别对准标识符采取的泛化操作,所谓泛化指的是将一个比较具体的属性值用一个更为宽泛的域值取代,即对数据进行更概括和更抽象的描述。例如,年龄21被泛化成[20-30]。对于解决这个问题目前主要存在一些启发式算法。一种是基于海明距离的二分法所搜算法,每一位的选择由权值来决定。这种算法能快速推荐一些较好的策略,但是推荐的准确性不高且推荐策略的范围小。另一种是基于概率的启发式搜索算法,搜索范围扩大覆盖整个RU空间,但是以一定的路径每次选取一定量的策略进行Skyline处理,Skyline操作是从候选策略中筛选出一系列“感兴趣”的策略,这些“感兴趣”的策略指的是那些不被其他策略“支配”的策略。即要求策略的R值和U值不能都比其他筛选掉的大。由于是近似处理,筛选的误差与初始的策略集合和路径选取有关。同时算法收敛速度较慢。
综上所述,现有隐私保护方法存在对RU空间覆盖范围小、不能满足用户多层次的需求、在风险量和信息损失量两个方面表现都较差、准确性不高且推荐策略的范围小以及算法收敛速度较慢等问题。
发明内容
针对现有技术的缺陷,本发明的目的在于解决现有隐私保护方法对RU空间覆盖范围小、不能满足用户多层次的需求、在风险量R和信息损失量U两个方面表现都较差、准确性不高且推荐策略的范围小以及算法收敛速度较慢的技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710339575.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种输液港注射端头装置
- 下一篇:一种医疗挂点滴用座椅本体
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置