[发明专利]一种基于改进KD树数据结构的隐私保护方法有效
申请号: | 201810344633.2 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108875401B | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 汪小寒;罗永龙;张泽培;韩慧慧;夏芸;左开中 | 申请(专利权)人: | 安徽师范大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 芜湖安汇知识产权代理有限公司 34107 | 代理人: | 方文倩 |
地址: | 241000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明适用于计算机数据隐私保护技术领域,提供了一种基于改进KD树数据结构的隐私保护方法,该方法先按照一定的概率比率选取部分维度来代替从全部维度中寻找最优的维度,将局部最优维度作为全局最优维度,然后在该维度上寻找最优划分点,最优划分点的选取上采用了一种双区间寻找方法,通过增大划分点的搜索范围,找出最优划分点,可以让划分更加合理、提高数据质量,从而弥补概率选最优维度算法在数据质量上的不足,保证算法匿名后数据质量和可用性更高。 | ||
搜索关键词: | 一种 基于 改进 kd 数据结构 隐私 保护 方法 | ||
【主权项】:
1.一种基于改建KD树数据结构的隐私保护方法,其特征在于,所述方法包括如下步骤:S1、将原始数据表存储为m维向量,一个所述m维向量称为一个结点;S2、创建一个列队及KD树的根结点,将根结点及结点放入列队中;S3、判断队列中的每个结点是否k匿名条件,若满足,至直接出队,若不满足,则保留在列队,保留在列队中的结点称为待划分结点;S4、当列队中的待划分结点不为空时,取队头结点,计算队头结点每个属性的维度聚合度量,将维度聚合度量的最大值作为所述结点的最优维度属性;S5、获取最优维度属性下的最优划分点p,最优划分点为数据点均域最小值对应的点;S6、在最优划分点p处进行划分,将当前结点划分为两个容量较小的匿名等价簇nl和nr,nl和nr即为p结点的子结点,即生成左、右子树,S7、将子节点nl和子节点nr入队;S8、返回步骤S4,直到队列中的待划分结点为空,即所有的结点均满足匿名条件出队,KD树构建完成;S9、遍历每个叶子结点,得到每个叶子结点中的等价簇中的数据并进行匿名化,生成匿名表T。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽师范大学,未经安徽师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810344633.2/,转载请声明来源钻瓜专利网。