[发明专利]一种基于准标识属性泛化的k-匿名隐私保护方法在审

专利信息
申请号: 201910128727.0 申请日: 2019-02-21
公开(公告)号: CN109918941A 公开(公告)日: 2019-06-21
发明(设计)人: 肖跃雷;朱志祥 申请(专利权)人: 陕西艾特信息化工程咨询有限责任公司
主分类号: G06F21/62 分类号: G06F21/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 712000 陕西省咸阳市西*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标识属性 全域 匿名模型 隐私保护 发布 数据分布 层次树 重复 检验
【说明书】:

发明提供了一种基于准标识属性泛化的k‑匿名隐私保护方法,其特殊之处在于:该方法包括:1)对于待发布数据表中的各个准标识属性,根据数据分布情况和业务情况建立各个准标识属性的泛化层次树;2)计算各个准标识属性的泛化层次高度、属性取值个数、属性取值频次和属性取值熵值;3)按照泛化层次高度最大、属性取值频次最小、属性取值个数最多和属性取值熵值最小的优先顺序,选择一个准标识属性进行一个层次的全域泛化;4)对步骤3)中全域泛化后的待发布数据表进行k‑匿名模型检验;若符合k‑匿名模型,则以步骤3)中全域泛化后的待发布数据表为最终发布数据表;否则,重复进行步骤2)、步骤3)和步骤4)。

技术领域

本发明涉及数据隐私保护领域,更具体地,涉及一种基于准标识属性泛化的k-匿名隐私保护方法。

背景技术

随着社会信息化和网络化的发展,数据呈现爆炸式增长,大数据时代已经到来;目前,大数据已成为学术界和产业界的研究热点,正影响着人们日常生活、工作习惯及思维方式;在数据发布应用中,如何保护数据的用户隐私已成为当前面临的重大挑战;最简单的保护用户隐私的方法就是在发布原始数据时直接通过删除姓名、身份证号码等标识属性来达到防范用户隐私泄露;但是由于以这种方式发布的数据集中的某些属性值集合能够联合该数据集外的相关信息精确或较精确地重新标识某个体,称之为链接攻击。

为了解决这种链接攻击,研究者们提出了k-匿名模型,它要求所发布的数据表中的每一条记录不能区分于其他k-1条记录,即在满足k-匿名模型的数据表中,任意一条记录被重新标识出的风险都不会超过1/k;k-匿名模型通常将数据表的属性划分以下为四类:(1)标识属性:这类属性能够唯一标识个体身份的属性,如用户身份证号码、姓名等;(2)准标识属性:这类属性虽然不像标识属性一样能够直接标识个体身份,但是通过属性的链接可以标记出个体身份的一组属性,如准标识属性组{年龄,工作类型,肤色,性别};(3)敏感属性:这类属性涉及个体隐私信息,如薪水、健康状况等;(4)其它属性:指除标识属性、准标识属性和敏感属性外的属性。

一般遵循k-匿名模型的数据发布大多采用泛化和抑制技术,这在很大程度上造成了原始数据的信息损失;泛化是对数据进行更概括、更抽象的描述;抑制就是删除某一些数据项使其不发布或是用一种特殊的符号来代替某一数据项;例如,性别属性的泛化层次树,参见图1。

在图1中,性别属性的泛化层次为2(从底向上分别为0,1),而性别属性的泛化层次高度为1,性别属性的属性取值为“男”、“女”和“性别”;泛化方法可以分为全域泛化和局部泛化两种;全域泛化是对一个属性上的所有属性取值同时进行泛化,如图1中“男”和“女”同时泛化为“性别”;局部泛化是对一个属性上的部分属性取值进行泛化,如图1中“男”泛化为“性别”,而“女”不进行泛化;全域泛化的优点是每次属性泛化完成后,该属性上的所有属性取值都保持在同一个泛化层次,有利于数据分析,而局部泛化不能保障这一点;但是,全域泛化一般比局部泛化的信息损失要大;因此,如何使得发布的数据表在满足k-匿名模型的同时,既有利于数据分析又减少信息损失,这已成为隐私保护研究的重点。

发明内容

为了解决背景技术中存在的上述技术问题,本发明提供了一种既有利于数据分析又减少信息损失的基于准标识属性泛化的k-匿名隐私保护方法。

本发明的技术解决方案是:本发明提供了一种基于准标识属性泛化的k-匿名隐私保护方法,其特殊之处在于:该方法包括。

1)对于待发布数据表中的各个准标识属性,根据数据分布情况和业务情况建立各个准标识属性的泛化层次树。

2)对于待发布数据表中的各个准标识属性,计算各个准标识属性的泛化层次高度,以及属性取值个数、属性取值频次和属性取值熵值。

3)对于待发布数据表中的各个准标识属性,按照泛化层次高度最大、属性取值频次最小、属性取值个数最多和属性取值熵值最小的优先顺序,选择一个准标识属性进行一个层次的全域泛化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西艾特信息化工程咨询有限责任公司,未经陕西艾特信息化工程咨询有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910128727.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top