[发明专利]一种基于准标识属性泛化的k-匿名隐私保护方法在审
申请号: | 201910128727.0 | 申请日: | 2019-02-21 |
公开(公告)号: | CN109918941A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 肖跃雷;朱志祥 | 申请(专利权)人: | 陕西艾特信息化工程咨询有限责任公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 712000 陕西省咸阳市西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标识属性 全域 匿名模型 隐私保护 发布 数据分布 层次树 重复 检验 | ||
本发明提供了一种基于准标识属性泛化的k‑匿名隐私保护方法,其特殊之处在于:该方法包括:1)对于待发布数据表中的各个准标识属性,根据数据分布情况和业务情况建立各个准标识属性的泛化层次树;2)计算各个准标识属性的泛化层次高度、属性取值个数、属性取值频次和属性取值熵值;3)按照泛化层次高度最大、属性取值频次最小、属性取值个数最多和属性取值熵值最小的优先顺序,选择一个准标识属性进行一个层次的全域泛化;4)对步骤3)中全域泛化后的待发布数据表进行k‑匿名模型检验;若符合k‑匿名模型,则以步骤3)中全域泛化后的待发布数据表为最终发布数据表;否则,重复进行步骤2)、步骤3)和步骤4)。
技术领域
本发明涉及数据隐私保护领域,更具体地,涉及一种基于准标识属性泛化的k-匿名隐私保护方法。
背景技术
随着社会信息化和网络化的发展,数据呈现爆炸式增长,大数据时代已经到来;目前,大数据已成为学术界和产业界的研究热点,正影响着人们日常生活、工作习惯及思维方式;在数据发布应用中,如何保护数据的用户隐私已成为当前面临的重大挑战;最简单的保护用户隐私的方法就是在发布原始数据时直接通过删除姓名、身份证号码等标识属性来达到防范用户隐私泄露;但是由于以这种方式发布的数据集中的某些属性值集合能够联合该数据集外的相关信息精确或较精确地重新标识某个体,称之为链接攻击。
为了解决这种链接攻击,研究者们提出了k-匿名模型,它要求所发布的数据表中的每一条记录不能区分于其他k-1条记录,即在满足k-匿名模型的数据表中,任意一条记录被重新标识出的风险都不会超过1/k;k-匿名模型通常将数据表的属性划分以下为四类:(1)标识属性:这类属性能够唯一标识个体身份的属性,如用户身份证号码、姓名等;(2)准标识属性:这类属性虽然不像标识属性一样能够直接标识个体身份,但是通过属性的链接可以标记出个体身份的一组属性,如准标识属性组{年龄,工作类型,肤色,性别};(3)敏感属性:这类属性涉及个体隐私信息,如薪水、健康状况等;(4)其它属性:指除标识属性、准标识属性和敏感属性外的属性。
一般遵循k-匿名模型的数据发布大多采用泛化和抑制技术,这在很大程度上造成了原始数据的信息损失;泛化是对数据进行更概括、更抽象的描述;抑制就是删除某一些数据项使其不发布或是用一种特殊的符号来代替某一数据项;例如,性别属性的泛化层次树,参见图1。
在图1中,性别属性的泛化层次为2(从底向上分别为0,1),而性别属性的泛化层次高度为1,性别属性的属性取值为“男”、“女”和“性别”;泛化方法可以分为全域泛化和局部泛化两种;全域泛化是对一个属性上的所有属性取值同时进行泛化,如图1中“男”和“女”同时泛化为“性别”;局部泛化是对一个属性上的部分属性取值进行泛化,如图1中“男”泛化为“性别”,而“女”不进行泛化;全域泛化的优点是每次属性泛化完成后,该属性上的所有属性取值都保持在同一个泛化层次,有利于数据分析,而局部泛化不能保障这一点;但是,全域泛化一般比局部泛化的信息损失要大;因此,如何使得发布的数据表在满足k-匿名模型的同时,既有利于数据分析又减少信息损失,这已成为隐私保护研究的重点。
发明内容
为了解决背景技术中存在的上述技术问题,本发明提供了一种既有利于数据分析又减少信息损失的基于准标识属性泛化的k-匿名隐私保护方法。
本发明的技术解决方案是:本发明提供了一种基于准标识属性泛化的k-匿名隐私保护方法,其特殊之处在于:该方法包括。
1)对于待发布数据表中的各个准标识属性,根据数据分布情况和业务情况建立各个准标识属性的泛化层次树。
2)对于待发布数据表中的各个准标识属性,计算各个准标识属性的泛化层次高度,以及属性取值个数、属性取值频次和属性取值熵值。
3)对于待发布数据表中的各个准标识属性,按照泛化层次高度最大、属性取值频次最小、属性取值个数最多和属性取值熵值最小的优先顺序,选择一个准标识属性进行一个层次的全域泛化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西艾特信息化工程咨询有限责任公司,未经陕西艾特信息化工程咨询有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910128727.0/2.html,转载请声明来源钻瓜专利网。