[发明专利]一种基于排序的微聚集匿名化方法有效
| 申请号: | 201711210204.8 | 申请日: | 2017-11-28 |
| 公开(公告)号: | CN108052832B | 公开(公告)日: | 2021-09-07 |
| 发明(设计)人: | 许国艳;宋健;李敏佳;平萍;张网娟;朱帅 | 申请(专利权)人: | 河海大学 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210098 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供一种基于排序的微聚集匿名化方法,该方法包括以下步骤:(1)排序操作:基于Ql准标识符对数据集划分为多个类,使得k‑划分是所述数据集基于Ql准标识符的;(2)基于排序的划分操作:从排序操作后的数据集初始化的第一条和最后一条两个极端记录开始分别系统地形成等价类,等价类的记录数保持在k之内;(3)聚集操作:以所述两个极端记录的中心点作为每个等价类的质心点,以所述等价类的均值代替所有的敏感属性值形成匿名等价类。本发明首先是根据均值排序技术对k‑划分过程进行有效的改进,确保其信息损失率降到最低,提高算法的执行效率并且在引入排序的概念后可以处理多维数据集,其次能够提高略高的隐私保护。 | ||
| 搜索关键词: | 一种 基于 排序 聚集 匿名 方法 | ||
【主权项】:
1.一种基于排序的微聚集匿名化方法,其特征在于,该方法包括以下步骤:(1)排序操作:基于Ql准标识符对数据集划分为多个类,使得k-划分是所述数据集基于Ql准标识符的,k是匿名参数,依据数值型属性值对所述数据集排序;(2)基于排序的划分操作:从排序操作后的数据集初始化的第一条和最后一条两个极端记录开始分别系统地形成等价类,等价类的记录数保持在k之内;(3)聚集操作:以所述两个极端记录的中心点作为每个等价类的质心点,以所述等价类的均值代替所有的敏感属性值形成匿名等价类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711210204.8/,转载请声明来源钻瓜专利网。





