[发明专利]一种基于Skyline的数据泛化方法有效

专利信息
申请号: 201710339575.X 申请日: 2017-05-15
公开(公告)号: CN107194278B 公开(公告)日: 2019-11-22
发明(设计)人: 丁晓锋;金海;王丽 申请(专利权)人: 华中科技大学
主分类号: G06F21/62 分类号: G06F21/62
代理公司: 42201 华中科技大学专利中心 代理人: 廖盈春;李智<国际申请>=<国际公布>=
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 skyline 数据 泛化 方法
【权利要求书】:

1.一种应用于隐私保护领域的基于Skyline的数据泛化方法,其特征在于,包括:

步骤S101,根据数据发布隐私保护标准10-匿名对数据表处理得到策略的再识别的风险量记为阈值,并根据数据表的准标识符属性的值域和阈值,确定策略空间,所述策略空间包括的策略的再识别的风险量不大于所述阈值;所述数据表包括用户隐私信息;

步骤S102,对所述策略空间采用近似Skyline进行过滤得到候选策略空间;所述近似Skyline为将Skyline的支配域按预设比例放大,生成近似的支配域,所述预设比例根据预设安全参数确定;所述支配域为若策略A的再识别的风险量和信息损失量均大于策略B的再识别的风险量值和信息损失量值,则策略A在策略B的支配域中;

所述步骤S102包括以下子步骤:

对所述数据表的准标识符属性的值域,多次迭代进行二分处理,直至所述准标识符属性的值域无法进行划分,每次迭代对应产生一个策略,多次迭代对应的策略的集合为初始策略集;

根据所述初始策略集对策略空间{S,(R,U)}采用近似Skyline进行过滤,将策略空间{S,(R,U)}中的未被所述初始策略集支配的策略归入所述初始策略集,并对所述初始策略集进行更新,将策略空间{S,(R,U)}中的被所述初始策略集支配的策略过滤,同时,将初始策略空间中的被{S,(R,U)}支配的策略过滤;

对所述策略空间{S,(R,U)}中的策略逐一采用近似Skyline进行过滤,当所述策略空间{S,(R,U)}被过滤为空时,此时更新得到的初始策略集为候选策略空间{G,(R,U)};所述再识别的风险量R和信息损失量U分别通过以下公式确定:

其中,P表示等价类的记录分布,P‘表示泛化后的等价类的记录分布,|e'|是等价类e'包含的记录数,且全部等价类e'构成所述P‘,N表示整个数据表的记录数,N≥1,|e*|是等价类e泛化后生成的新的等价类包含平均记录数,所述等价类是指数据表中具有相同准标识符属性的记录集合;

步骤S103,对所述候选策略空间作Skyline操作,得到推荐的策略空间,以通过为数据表推荐策略来对数据表的数据进行泛化而保护用户的隐私信息;所述推荐的策略空间包括为所述数据表推荐的策略及相应的再识别的风险量和信息损失量,所述推荐的策略空间包括的每种策略对应对所述数据表信息的一种泛化操作。

2.如权利要求1所述的数据泛化方法,其特征在于,所述步骤S101包括以下子步骤:

根据数据表的准标识符属性的值域枚举2L个策略,其中,L=r1-1+…+rn-1,所述2L个策略对应n种属性,第i个属性对应ri个取值,所述ri个取值对应种策略,1≤i≤n,n≥1;

确定2L个策略中每一个策略的再识别的风险量R值,在所述2L个策略中将R值大于阈值T的策略过滤掉,确定策略集;

确定所述策略集中每个策略的信息损失量U,根据所述每个策略的R值和U值,确定所述策略空间{S,(R,U)},R≥0,U≥0,T≥0。

3.如权利要求1所述的数据泛化方法,其特征在于,所述步骤S103包括以下子步骤:

对候选策略空间{G,(R,U)}进行分块,将每块策略空间对应的数据在其所在的节点进行排序;

确定每块策略空间中最小的再识别的风险量R值和最小的信息损失量U值;

根据每块策略空间中最小的R值和最小的U值确定Skyline集合的策略及所述推荐的策略空间{F,(R,U)}。

4.如权利要求1所述的数据泛化方法,其特征在于,ε-近似Skyline为将Skyline的支配域按预设比例放大,生成近似的支配域,所述预设比例根据ε确定,具体包括:

若策略A的R和U取值比策略B的R值和U值至多均大ε倍,则策略A以精度ε近似支配策略B,记为A<εB。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710339575.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top