[发明专利]一种基于Skyline的数据泛化方法有效
| 申请号: | 201710339575.X | 申请日: | 2017-05-15 |
| 公开(公告)号: | CN107194278B | 公开(公告)日: | 2019-11-22 |
| 发明(设计)人: | 丁晓锋;金海;王丽 | 申请(专利权)人: | 华中科技大学 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62 |
| 代理公司: | 42201 华中科技大学专利中心 | 代理人: | 廖盈春;李智<国际申请>=<国际公布>= |
| 地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 skyline 数据 泛化 方法 | ||
1.一种应用于隐私保护领域的基于Skyline的数据泛化方法,其特征在于,包括:
步骤S101,根据数据发布隐私保护标准10-匿名对数据表处理得到策略的再识别的风险量记为阈值,并根据数据表的准标识符属性的值域和阈值,确定策略空间,所述策略空间包括的策略的再识别的风险量不大于所述阈值;所述数据表包括用户隐私信息;
步骤S102,对所述策略空间采用近似Skyline进行过滤得到候选策略空间;所述近似Skyline为将Skyline的支配域按预设比例放大,生成近似的支配域,所述预设比例根据预设安全参数确定;所述支配域为若策略A的再识别的风险量和信息损失量均大于策略B的再识别的风险量值和信息损失量值,则策略A在策略B的支配域中;
所述步骤S102包括以下子步骤:
对所述数据表的准标识符属性的值域,多次迭代进行二分处理,直至所述准标识符属性的值域无法进行划分,每次迭代对应产生一个策略,多次迭代对应的策略的集合为初始策略集;
根据所述初始策略集对策略空间{S,(R,U)}采用近似Skyline进行过滤,将策略空间{S,(R,U)}中的未被所述初始策略集支配的策略归入所述初始策略集,并对所述初始策略集进行更新,将策略空间{S,(R,U)}中的被所述初始策略集支配的策略过滤,同时,将初始策略空间中的被{S,(R,U)}支配的策略过滤;
对所述策略空间{S,(R,U)}中的策略逐一采用近似Skyline进行过滤,当所述策略空间{S,(R,U)}被过滤为空时,此时更新得到的初始策略集为候选策略空间{G,(R,U)};所述再识别的风险量R和信息损失量U分别通过以下公式确定:
其中,P表示等价类的记录分布,P‘表示泛化后的等价类的记录分布,|e'|是等价类e'包含的记录数,且全部等价类e'构成所述P‘,N表示整个数据表的记录数,N≥1,|e*|是等价类e泛化后生成的新的等价类包含平均记录数,所述等价类是指数据表中具有相同准标识符属性的记录集合;
步骤S103,对所述候选策略空间作Skyline操作,得到推荐的策略空间,以通过为数据表推荐策略来对数据表的数据进行泛化而保护用户的隐私信息;所述推荐的策略空间包括为所述数据表推荐的策略及相应的再识别的风险量和信息损失量,所述推荐的策略空间包括的每种策略对应对所述数据表信息的一种泛化操作。
2.如权利要求1所述的数据泛化方法,其特征在于,所述步骤S101包括以下子步骤:
根据数据表的准标识符属性的值域枚举2L个策略,其中,L=r1-1+…+rn-1,所述2L个策略对应n种属性,第i个属性对应ri个取值,所述ri个取值对应种策略,1≤i≤n,n≥1;
确定2L个策略中每一个策略的再识别的风险量R值,在所述2L个策略中将R值大于阈值T的策略过滤掉,确定策略集;
确定所述策略集中每个策略的信息损失量U,根据所述每个策略的R值和U值,确定所述策略空间{S,(R,U)},R≥0,U≥0,T≥0。
3.如权利要求1所述的数据泛化方法,其特征在于,所述步骤S103包括以下子步骤:
对候选策略空间{G,(R,U)}进行分块,将每块策略空间对应的数据在其所在的节点进行排序;
确定每块策略空间中最小的再识别的风险量R值和最小的信息损失量U值;
根据每块策略空间中最小的R值和最小的U值确定Skyline集合的策略及所述推荐的策略空间{F,(R,U)}。
4.如权利要求1所述的数据泛化方法,其特征在于,ε-近似Skyline为将Skyline的支配域按预设比例放大,生成近似的支配域,所述预设比例根据ε确定,具体包括:
若策略A的R和U取值比策略B的R值和U值至多均大ε倍,则策略A以精度ε近似支配策略B,记为A<εB。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710339575.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种输液港注射端头装置
- 下一篇:一种医疗挂点滴用座椅本体
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





