[发明专利]一种面向多视图聚类挖掘的个性化隐私保护方法有效
| 申请号: | 201710717235.6 | 申请日: | 2017-08-21 |
| 公开(公告)号: | CN107688752B | 公开(公告)日: | 2020-11-20 |
| 发明(设计)人: | 徐东;李贤;张子迎;孟宇龙;张朦朦;姬少培;王岩俊;吕骏;方一成;王杰 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 视图 挖掘 个性化 隐私 保护 方法 | ||
本发明公开了一种面向多视图聚类挖掘的个性化隐私保护方法,属于信息安全技术领域。本发明提出隐私偏序拓扑分类算法(PT,Privacy Topology),针对不同隐私数据的敏感性差异表示问题,先定义隐私关系并构建隐私偏序集,据此设计隐私数据的拓扑分类算法求解隐私线序集。针对隐私数据的多个视图,对原始数据、隐私度、元组敏感度、隐私线序集等视图进行多视图聚类。提出面向聚类的个性化匿名算法(PPOC,Personal Privacy Oriented Classtering),通过可变k‑匿名策略,利用面向多视图聚类的满足个性化需求的隐私保护算法,实现对不同聚类簇以及同簇内部不同元组施加程度有别的个性化保护操作。
技术领域
本发明为一种面向多视图聚类挖掘的个性化隐私保护方法,涉及信息安全技术领域。
背景技术
随着互联网、物联网、智慧城市等数字化技术的发展,传感器、移动终端等各类数据收集设备将人类的衣食住行各类信息以数字化形式存储起来,从而催生了大数据时代的到来。数据首次作为一种资源,受到了政府、企业以及学术界等社会实体的高度关注。
然而在数据使用过程中,个人的隐私信息可能遭到泄露。在发掘数据潜在价值的过程中,如何保障个人的隐私安全,尤其是如何避免数据挖掘带来的隐私泄露,是数据科学目前亟需解决的关键问题。隐私数据对个人或团体而言是特殊的或敏感的,是其不愿意泄露的信息。隐私信息的保护程度决定着用户对相关服务的信任度和接受性,是数据价值能否找到受众的基础。
数据在发布、存储、挖掘和使用的整个生命周期中都可能存在隐私泄露风险。数据在发布和使用过程中的隐私安全问题已受到学术界的普遍关注,并已产生了大量有意义的研究成果。随着数据挖掘技术在应用层面的普及,面向挖掘的隐私安全问题已经得到了广泛关注,隐私保护领域的研究焦点和重心正在逐步向隐私保护数据挖掘领域偏移。面向聚类挖掘的隐私保护技术是前沿热点。
不同的人对隐私的定义理解是不同的,相同的个体对不同数据隐私的定义也会存在差别。个性化隐私保护能根据用户的不同要求,对数据中的敏感属性值提供不同程度的隐私保护。因此个性化的隐私保护技术更具针对性,针对个性化需求的隐私保护技术研究是学界的前沿热点课题。
总结现有研究成果发现,目前个性化隐私保护研究面临如下关键问题亟需解决:
(1)现存算法几乎是针对数据发布需求而设计的,未涉足聚类挖掘可能导致的隐私安全问题;
(2)已有个性化隐私保护算法未综合考虑用户对隐私认知的差异性和不同属性重要度的差异性,其个性化程度有待提升,且信息损失较大。
发明内容
本发明的目的在于提供一种面向多视图聚类挖掘的个性化隐私保护方法。
本发明针对隐私保护挖掘和个性化隐私保护的上述局限性,提出一种面向多视图聚类挖掘的个性化隐私保护方法。
本发明的目的是通过以下步骤实现的:
一种面向多视图聚类挖掘的个性化隐私保护方法,其特征在于,包含以下步骤:
步骤一 定义隐私关系;隐私数据集合D中的一条记录为多重组d=(d1,d2,…,dn),序偶di=ai,si∈d,ai为字段Ai上的原始数据值,si为ai对应的隐私度;称卡氏积D×D的下述子集为D上的隐私关系:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710717235.6/2.html,转载请声明来源钻瓜专利网。





