[发明专利]基于聚类匿名化与差分隐私保护的异构用电数据发布方法在审
申请号: | 202111191708.6 | 申请日: | 2021-10-13 |
公开(公告)号: | CN114092729A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 奚建飞;徐欢;雷美炼;张锐;沈博;孙一帆 | 申请(专利权)人: | 南方电网数字电网研究院有限公司;中国南方电网有限责任公司;中国科学院信息工程研究所 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06K9/62 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 李文涛 |
地址: | 510700 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 匿名 隐私 保护 用电 数据 发布 方法 | ||
本发明公开了一种基于聚类匿名化与差分隐私保护的异构用电数据发布方法,涉及信息技术安全领域,以实现对异构用电数据进行隐私保护的目的,将聚类分析问题转化为分类问题,利用类标签对原始数据的聚类结构同时进行泛化匿名机制和加噪处理后,发布满足∈‑差分隐私保护的电力交易数据集,实现了灵活的隐私保护聚类分析,提升发布数据用于聚类分析时的准确性,同时保证了多种类型数据的隐私性和可用性,为用电数据分析提供可靠的数据。
技术领域
本发明涉及信息技术安全领域,具体涉及一种基于匿名化与差分隐私的异构用电数据发布方法。
背景技术
随着智能电网采集、处理和存储能力的快速提高,所采集用电数据的也有了巨大的增长。对于收集到的多种类型的用电数据,利用大数据分析和挖掘技术,不仅可以准确分析个人用电情况,还可以为用户提供个性化的用电服务。然而,原始用电数据往往包含有关个人的敏感信息,直接发布用电数据会导致个人隐私泄露。因此,如何在准确分析用户用电数据的同时,保护用户的隐私不被泄露,成为亟待解决的问题。
隐私保护数据发布是近年来研究的热点,其目的是在挖掘和分析敏感数据的同时,保护数据集中的个人隐私。传统的隐私保护数据发布模型,如k-匿名、l-多样性、t-近似等模型,它们根据原始数据的特性,将全部数据记录泛化成为若干组记录,不仅使得每一组中的各个记录无法相互区分。差分隐私保护是一种更强健的隐私保护模型,它对隐私泄露风险给出了严格的、定量化的表示和证明,从根本上解决了传统的隐私保护方法无法量化隐私保护程度和缺少对攻击模型的定义等问题。
然而,在用电信息采集系统环境下,当输入数据集包含混合类型的属性时,如果要实现在差分隐私的约束下提供准确的数据发布结果,则需要解决两个关键问题:
(1)如何处理异构数据;
(2)如何降低查询敏感度。
因为,在非交互式用电信息采集场景中,使用差分隐私的噪声机制对数据集进行保护时,用电数据的异构性会使噪声机制引入大量的扰动误差,使得对隐私保护用电数据进行聚类分析时无法提供准确的分析结果,导致发布数据失去应有的可用性,直接制约了差分隐私在非交互式隐私保护数据发布中的应用。
发明内容
本发明提出了一种基于聚类匿名化与差分隐私保护的异构用电数据发布方法,以实现对异构用电数据进行隐私保护的目的,而且在有效地保护用电数据隐私性的情况下,提升了发布数据用于聚类分析时的准确性,为用电数据分析提供可靠的数据。
为了解决上述问题,本发明提供了一种基于聚类匿名化与差分隐私保护的异构用电数据发布方法,所述方法包括以下步骤:
根据数据使用者的聚类分析请求,对原始数据集D中的原始用电数据进行聚类处理,得到具有类标签的标签数据集D*,标签数据集D*包括多个原始数据记录;
对标签数据集D*中的数值型属性、分类型属性、集值型属性分别进行泛化处理;
对泛化处理后的数据进行以下匿名处理:按照预定义的分类树对分类型属性数据进行分组,利用拉普拉斯机制对集值型属性数据添加噪声,利用指数机制对数值型属性数据添加噪声,确保数据满足差分隐私,得到匿名数据集D′;
通过在匿名数据集D′上删除任意一条数据记录并添加噪声后获得满足差分隐私的查询集,计算上述查询集与原始数据集的真实查询集的相似度,当该相似度大于0时,发布满足差分隐私保护的数据集给所述数据使用者。
进一步地,采用k-means算法或DBSCAN算法进行聚类处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网数字电网研究院有限公司;中国南方电网有限责任公司;中国科学院信息工程研究所,未经南方电网数字电网研究院有限公司;中国南方电网有限责任公司;中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111191708.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:复合材料及其制备方法、应用
- 下一篇:一种便携式口腔护理仪器