[发明专利]基于FP-growth的多源数据关联隐私泄露风险评估系统在审
| 申请号: | 201910488174.X | 申请日: | 2019-06-05 |
| 公开(公告)号: | CN110222058A | 公开(公告)日: | 2019-09-10 |
| 发明(设计)人: | 白林;周莅涛;李适季;施全立;陈天立;张宏伟 | 申请(专利权)人: | 深圳市优网科技有限公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458;G06Q10/06 |
| 代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 占丽君 |
| 地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 隐私泄露 隐私数据库 分析数据 脆弱性分析 风险评估 风险评估系统 单一数据 多源数据 构建 关联分析单元 关联分析算法 关联性数据 关联 单元获取 关联规则 计算单元 评估单元 第三方 多维 多源 脱敏 向量 评估 分析 合作 | ||
1.一种基于FP-growth的多源数据关联隐私泄露风险评估系统,其特征在于,包括:
脆弱性分析单元:用于获取待分析数据源,并对所述待分析数据源进行脆弱性分析,构建隐私数据库;
关联分析单元:用于使用FP-growth关联分析算法对所述隐私数据库进行多维关联性数据分析,获取强关联规则;
风险值计算单元:用于结合脆弱性分析结果,计算所述隐私数据库中单一数据源的隐私泄露风险值;
评估单元:用于结合所述隐私泄露风险值构建风险评估体系;还用于利用所述风险评估体系,对所述隐私数据库中单一数据源进行多源隐私泄露风险评估,获得待分析数据源的风险向量,对该待分析数据源进行评估。
2.根据权利要求1所述基于FP-growth的多源数据关联隐私泄露风险评估系统,其特征在于,所述脆弱性分析单元具体用于:
对所述待分析数据源进行脆弱性分析;
结合预设的隐私类别,对经过脆弱性分析后的数据进行分类;
对分类后的数据进行数据格式处理,根据处理后的数据构建所述隐私数据库。
3.根据权利要求1所述基于FP-growth的多源数据关联隐私泄露风险评估系统,其特征在于,所述关联分析单元具体用于:
创建FP-tree,并利用FP-growth算法挖掘所述FP-tree的频繁项集;
设置最小支持度阈值和最小置信度阈值;
根据所述最小支持度阈值和最小置信度阈值获得各个项集之间的强关联规则。
4.根据权利要求3所述基于FP-growth的多源数据关联隐私泄露风险评估系统,其特征在于,所述关联分析单元具体用于:
对所述隐私数据库进行元素定义:定义I={i1,i2,...,im}为包含m个不同项目ij的集合,称为项集;则隐私数据库D分为n个项集I,即D={I1,I2,…,In},每个事务T为包含有若干个项集I的集合,即
扫描隐私数据库D,确定所述隐私数据库D中每个项集I的支持度,将频繁项集按照支持度的递减排序,排序结果为结果L;
再次扫描隐私数据库D,构建FP-tree:创建FP-tree的根节点,标记为null;对于每一个隐私数据库D中的每个事务T,选择事务T中的频繁项集,并按照结果L中的次序进行排序;排序后的频繁项表记为[p|P],其中p是第一个元素,P是剩余元素的表;
调用INSERT_TREE([p|P],T);如果事务T有子节点N满足N.item-name=p.item-name,则N的计数增加1;否则创建一个新节点N,数值设置为1,链接到其父节点T上,并且通过节点链结构将其链接到具有相同item-name的节点上;
如果P非空,则递归调用INSERT_TREE(P,N),直到P为空。
5.根据权利要求3所述基于FP-growth的多源数据关联隐私泄露风险评估系统,其特征在于,所述关联分析单元具体用于:
将每一对项集表示为一个关联规则,扫描所有的关联规则,筛选出同时满足所述最小支持度阈值和最小置信度阈值的关联规则,即为各个项集之间的强关联规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优网科技有限公司,未经深圳市优网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910488174.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种气溶胶文献格式化数据库的构建方法
- 下一篇:一种数据管理系统和方法





