[发明专利]一种满足差分隐私的不确定数据频繁项集挖掘方法在审

专利信息
申请号: 201910917374.2 申请日: 2019-09-26
公开(公告)号: CN110633285A 公开(公告)日: 2019-12-31
发明(设计)人: 韩启龙;于洋;马志强;吴艳霞;刘书勇;李丽洁;周连科 申请(专利权)人: 哈尔滨工程大学
主分类号: G06F16/22 分类号: G06F16/22;G06F16/2458;G06F21/62
代理公司: 23211 哈尔滨市阳光惠远知识产权代理有限公司 代理人: 刘景祥
地址: 150001 黑龙江*** 国省代码: 黑龙;23
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种满足差分隐私的不确定数据频繁项集挖掘方法,所述方法包括以下步骤:步骤1:计算频繁1‑项集候选集,去掉非频繁项,使事务中项按支持度降序排列;步骤2:根据预处理后数据集生成UFP‑tree树形结构的同时将隐私预算分配到UFP‑tree树形结构节点中;步骤3:采用递归与枚举结合的方式从UFP‑tree树形结构中挖掘频繁项集,挖掘过程中回收被剪枝节点的隐私预算;步骤4:采用指数机制从挖掘出的项集中选择k个,打分函数为项集的期望支持度,对未被选中的频繁项集的隐私预算再次回收并分配给选中的1‑项集。本发明通过降低匿名率,关联属性共同置换,在保证隐私保护强度的同时,提高数据的可用性。
搜索关键词: 频繁项集 树形结构 隐私 挖掘 支持度 预处理 可用性 关联属性 降序排列 隐私保护 预算分配 回收 候选集 数据集 剪枝 预算 递归 枚举 置换 期望 分配 事务 保证
【主权项】:
1.一种满足差分隐私的不确定数据频繁项集挖掘方法,其特征在于:所述方法包括以下步骤:/n步骤1:计算频繁1-项集候选集,根据候选集对数据集进行预处理,去掉非频繁项,使事务中项按支持度降序排列;/n步骤2:根据预处理后数据集生成UFP-tree树形结构的同时将隐私预算分配到UFP-tree树形结构节点中;/n步骤3:采用递归与枚举结合的方式从UFP-tree树形结构中挖掘频繁项集,挖掘过程中回收被剪枝节点的隐私预算;/n步骤4:采用指数机制从挖掘出的项集中选择k个,打分函数为项集的期望支持度,对未被选中的频繁项集的隐私预算再次回收并分配给选中的1-项集,使用拉普拉斯机制对选中频繁项集添加噪声。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910917374.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top