[发明专利]基于密度划分的k‑匿名隐私保护方法在审
申请号: | 201710404771.0 | 申请日: | 2017-06-01 |
公开(公告)号: | CN107292195A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 吴响;胡俊峰;魏裕阳;毛亚青 | 申请(专利权)人: | 徐州医科大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 北京盛凡智荣知识产权代理有限公司11616 | 代理人: | 晏荣府 |
地址: | 221004 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 密度 划分 匿名 隐私 保护 方法 | ||
1.一种基于密度划分的k-匿名隐私保护方法,其特征在于:包括一次划分单元和二次划分单元,具体如下:
一次划分单元:根据各条记录在准标识符属性上的欧式距离,对数值型原始数据集D进行一次基于密度的划分,得到若干个元组相似度较高的小数据集;
二次划分单元:根据各条记录在准标识符属性上的欧式距离,对一次划分单元中得到的每一个小数据集使用微聚集方法MDAV进行二次划分,得到若干个大小在k到2k-1的等价类,用每个等价类质心的准标识符属性值代替等价类中其余记录的准标识符属性值,得到满足k-匿名的数据集。
2.根据权利要求1所述的一种基于密度划分的k-匿名隐私保护方法,其特征在于:所述一次划分单元具体执行步骤如下:
1)访问数值型原始数据集D中的未标记节点,根据准标识符属性的值,计算该未标记节点与所有点的欧式距离,找到与该未标记节点距离小于等于e的所有点;
2)如果点的个数不小于密度阈值MinPts,则将所有的点聚为一类,并将步骤1)中的未标记节点标记为visited;如果步骤1)中的未标记节点附近点的数量小于密度阈值MinPts,则该点暂时被标记为噪声点,并标记为visited;
3)重复步骤1)和2)直到数值型原始数据集D中所有点均被标记为visited;
4)计算噪声点与所有聚类中心的距离,将噪声点归入它最近的聚类中,此时数值型原始数据集D被划分为若干个小数据集。
3.根据权利要求1或2所述的基于密度划分的k-匿名隐私保护方法,其特征在于:
将经过一次划分单元处理后的每个小数据集执行以下步骤;
1)根据欧式距离计算聚簇中心点x,找到距x最远的记录r,再找到距离r最远的记录s;
2)以x为中心,从每个分组中选择距离x最近的k个记录组成一个等价类,以s为中心,从每个分组中选择距离s最近的k个记录组成一个等价类;
3)若剩余记录数大于等于2k,则循环执行步骤2)直到剩余记录数小于2k;若剩余记录数在k到2k-1之间,则将剩余记录划分为一类;若剩余记录数小于k,则将剩余的记录归入离各自最近的等价类中;
4)用每个小的聚类质心的准标识符属性值代替类中各记录准标识符属性值,得到满足最优k划分的k-匿名表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐州医科大学,未经徐州医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710404771.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据保护方法、移动终端及存储介质
- 下一篇:IO数据的读写方法和装置