[发明专利]基于聚类匿名的隐私保护表数据共享方法有效

专利信息
申请号: 201910752801.6 申请日: 2019-08-15
公开(公告)号: CN110555316B 公开(公告)日: 2023-04-18
发明(设计)人: 刘丽苹;朴春慧 申请(专利权)人: 石家庄铁道大学
主分类号: G06F21/62 分类号: G06F21/62
代理公司: 石家庄轻拓知识产权代理事务所(普通合伙) 13128 代理人: 侯迎新
地址: 050043 河*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 匿名 隐私 保护 数据 共享 方法
【说明书】:

本发明涉及基于聚类匿名的隐私保护表数据共享算法,该方法首先通过k‑medios聚类算法对表中的记录进行聚类,得到多张数据表;然后结合信息损失量对每张数据表进行匿名处理,生成匿名数据表;最后对匿名数据表中的敏感属性值加入噪声,通过示例分析及与经典k‑匿名算法MDAV进行比较,进行算法的验证,证明了本算法的可用性以及隐私性,并具有较高的推广应用价值。

技术领域

专利申请属于隐私保护技术领域,更具体地说,是涉及一种基于聚类匿名的隐私保护表数据共享方法。

背景技术

随着数字政府的建设发展,政务数据逐渐增长,规模越来越大,类型越来越多,呈现出多样化和复杂化的特点。长期以来,由于“信息孤岛”、“数据壁垒”现象普遍存在,而数据价值不能得到充分发挥。政务数据共享能够将政务信息从一个部门转移到另一个部门,从而改善“数据孤岛”现象,使得数据发挥最大的价值,提高政府服务质量。表数据共享是政务数据共享的重要方式之一。

通常“隐私”是指数据所有权拥有者不愿被他人所获得的信息。然而,信息技术的发展必然会增强数据信息泄露的可能性,从而限制信息技术的发展。因此隐私问题逐渐引起了人们的关注。为了更加直观的体现出各界人士对“隐私”及“隐私保护”问题的关注程度,这里以每年与隐私相关的论文发表量大小进行衡量,作者在知网中以“隐私”作为主题关键字进行检索,然后在检索结果中再以“隐私保护”作为主题关键字进行检索,根据检索结果,绘制了自1990年以来,其每年所发表论文的篇数变化情况,如图1所示。

由图1可以看出,自2003年以来,人们对隐私问题及隐私保护问题的关注度迅速攀升。同时可以看出近年来,人们对隐私关注重点在隐私保护问题上,其关注度占隐私问题关注的一半左右。

基于此,需要提出一种保护方法,旨在保证数据可用性的同时确保数据的隐私性,并通过与传统匿名算法MDAV进行对比实验分析,以表明所提隐私保护方法能够很好的提高算法效率,并提供有效地隐私保护。

发明内容

本发明需要解决的技术问题是提供一种基于聚类匿名的隐私保护表数据共享方法,能够避免上述形式的弊端,能够提供有效地隐私保护。

为了解决上述问题,本发明所采用的技术方案是:

一种基于聚类匿名的隐私保护表数据共享方法,包括应用于共享静态数据表,步骤为:

Step 1、聚类处理:基于k-medios聚类的表数据记录划分,依据数据表中记录间的距离,使用k-medios聚类算法对共享静态数据表中的记录进行聚类,得到若干个簇,也即得到若干张数据表;

Step 2、匿名处理:对经过Step 1处理得到的每个簇分别进行处理,首先将簇中的数据依据信息损失量进行分割,然后对得到的每个簇进行调整,使得每个簇均满足k-匿名条件、且不存在敏感属性值完全相等的情况,最后对其进行泛化处理,从而生成匿名数据表;

Step 3、差分隐私加噪处理:对表数据中的敏感属性值进行差分隐私处理;

Step 4、比较验证:最后通过示例分析及与经典k-匿名算法MDAV进行比较,进行方法的可用性以及隐私性验证。

本发明技术方案的进一步改进在于:步骤Step 1中,表数据记录划分的核心思想为:利用聚类技术将共享静态数据表中n条记录划分为多个簇,使得相似度高的记录划分到一组;同时为了能够满足接下来的k-匿名需求,在聚类结束后需对不满足匿名要求的簇进行调整,因此,结合k-medios聚类算法,表数据记录划分的具体流程如下:

Step 11:归一化处理,对数据表中的非敏感有序分类型属性进行量化,也就是量化为数值1,2,3,···,n,然后将该有序分类型属性看做数值型属性进行处理,进而对数据表中的所有非敏感属性中的数值型属性数据进行归一化处理,归一化公式如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石家庄铁道大学,未经石家庄铁道大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910752801.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top