[发明专利]基于机器学习的集成隐私保护方法在审
申请号: | 201510947432.8 | 申请日: | 2015-12-16 |
公开(公告)号: | CN105512568A | 公开(公告)日: | 2016-04-20 |
发明(设计)人: | 李宇佳 | 申请(专利权)人: | 上海电机学院 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 上海思微知识产权代理事务所(普通合伙) 31237 | 代理人: | 菅秀君 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 集成 隐私 保护 方法 | ||
1.一种基于机器学习的集成隐私保护方法,其特征在于包括:
第一步骤:利用多个k-匿名算法生成覆盖数据库的原表的覆盖集,其中所 述原表由多个元组组成;
第二步骤:去除覆盖集中多余的元组以得到元组集;其中,对覆盖集中多 个相同元组进行部分删除以使得仅仅保留多个相同元组中的一个元组,由此使 得元组集中不存在重复的元组。
2.根据权利要求1所述的基于机器学习的集成隐私保护方法,其特征在于, 覆盖集中的每个元组集的大小都是在k和2k-1之间。
3.根据权利要求2所述的基于机器学习的集成隐私保护方法,其特征在于, 所述第一步骤包括:首先由多个k-匿名算法各自独立生成元组集,并且利用这 些元组集组成总集合,随后从总集合中选择部分元组集以组成覆盖集。
4.根据权利要求2所述的基于机器学习的集成隐私保护方法,其特征在于, 在所述第一步骤中,针对属于总集合的每个元组集计算比率,所述比率是用NCP 函数度量的元组集的信息损失除以该元组集贡献的元组数量,然后从中挑选比 率最低的元组集加入覆盖集。
5.根据权利要求1或2所述的基于机器学习的集成隐私保护方法,其特征 在于,所述第二步骤包括:
将覆盖集的元组集映射到原表的元组上;
如果特定元组同时出现在覆盖集的第一元组集与第二元组集中,如果第一 元组集与第二元组集的大小都等于k,则将第一元组集与第二元组集合并出新的 第二元组集,并且把第一元组集置空,同时新的第二元组集到原表的映射,去 除第一元组集到原表的映射。
6.根据权利要求5所述的基于机器学习的集成隐私保护方法,其特征在于, 如果第一元组集与第二元组集的大小没有都等于k,则从第一元组集与第二元组 集中比较大的一个中去掉所述特定元组。
7.根据权利要求1或2所述的基于机器学习的集成隐私保护方法,其特征 在于,所述原表是SAL表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电机学院,未经上海电机学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510947432.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理方法及电子设备
- 下一篇:参数检测方法及装置