[发明专利]一种基于Skyline的数据泛化方法有效
申请号: | 201710339575.X | 申请日: | 2017-05-15 |
公开(公告)号: | CN107194278B | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 丁晓锋;金海;王丽 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 42201 华中科技大学专利中心 | 代理人: | 廖盈春;李智<国际申请>=<国际公布>= |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于Skyline的数据泛化方法,包括:根据数据发布隐私保护标准10‑匿名对数据表处理得到策略的再识别的风险量R记为阈值T,并根据准标识符属性的值域和阈值T确定策略空间{S,(R,U)},{S,(R,U)}包括的策略的R值不大于阈值T;对策略空间{S,(R,U)}采用ε‑近似Skyline进行过滤得到候选策略空间{G,(R,U)};对候选策略空间{G,(R,U)}作Skyline计算,得到推荐的策略空间{F,(R,U)},{F,(R,U)}是为数据表推荐的隐私策略空间。本发明通过枚举全策略空间提高了隐私保护策略推荐的准确性,对RU空间的覆盖范围广,满足用户的多层次需求。设定阈值T过滤了隐私保护不达要求的策略,降低了策略空间生成的时间,采用ε‑近似‑Skyline过滤进一步降低了候选策略空间的规模。 | ||
搜索关键词: | 一种 基于 skyline 数据 泛化 方法 | ||
【主权项】:
1.一种应用于隐私保护领域的基于Skyline的数据泛化方法,其特征在于,包括:/n步骤S101,根据数据发布隐私保护标准10-匿名对数据表处理得到策略的再识别的风险量记为阈值,并根据数据表的准标识符属性的值域和阈值,确定策略空间,所述策略空间包括的策略的再识别的风险量不大于所述阈值;所述数据表包括用户隐私信息;/n步骤S102,对所述策略空间采用近似Skyline进行过滤得到候选策略空间;所述近似Skyline为将Skyline的支配域按预设比例放大,生成近似的支配域,所述预设比例根据预设安全参数确定;所述支配域为若策略A的再识别的风险量和信息损失量均大于策略B的再识别的风险量值和信息损失量值,则策略A在策略B的支配域中;/n所述步骤S102包括以下子步骤:/n对所述数据表的准标识符属性的值域,多次迭代进行二分处理,直至所述准标识符属性的值域无法进行划分,每次迭代对应产生一个策略,多次迭代对应的策略的集合为初始策略集;/n根据所述初始策略集对策略空间{S,(R,U)}采用近似Skyline进行过滤,将策略空间{S,(R,U)}中的未被所述初始策略集支配的策略归入所述初始策略集,并对所述初始策略集进行更新,将策略空间{S,(R,U)}中的被所述初始策略集支配的策略过滤,同时,将初始策略空间中的被{S,(R,U)}支配的策略过滤;/n对所述策略空间{S,(R,U)}中的策略逐一采用近似Skyline进行过滤,当所述策略空间{S,(R,U)}被过滤为空时,此时更新得到的初始策略集为候选策略空间{G,(R,U)};所述再识别的风险量R和信息损失量U分别通过以下公式确定:/n /n /n其中,P表示等价类的记录分布,P‘表示泛化后的等价类的记录分布,|e'|是等价类e'包含的记录数,且全部等价类e'构成所述P‘,N表示整个数据表的记录数,N≥1,|e*|是等价类e泛化后生成的新的等价类包含平均记录数,所述等价类是指数据表中具有相同准标识符属性的记录集合;/n步骤S103,对所述候选策略空间作Skyline操作,得到推荐的策略空间,以通过为数据表推荐策略来对数据表的数据进行泛化而保护用户的隐私信息;所述推荐的策略空间包括为所述数据表推荐的策略及相应的再识别的风险量和信息损失量,所述推荐的策略空间包括的每种策略对应对所述数据表信息的一种泛化操作。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710339575.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种输液港注射端头装置
- 下一篇:一种医疗挂点滴用座椅本体
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置