[发明专利]基于FP-growth的多源数据关联隐私泄露风险评估系统在审
| 申请号: | 201910488174.X | 申请日: | 2019-06-05 |
| 公开(公告)号: | CN110222058A | 公开(公告)日: | 2019-09-10 |
| 发明(设计)人: | 白林;周莅涛;李适季;施全立;陈天立;张宏伟 | 申请(专利权)人: | 深圳市优网科技有限公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458;G06Q10/06 |
| 代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 占丽君 |
| 地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 隐私泄露 隐私数据库 分析数据 脆弱性分析 风险评估 风险评估系统 单一数据 多源数据 构建 关联分析单元 关联分析算法 关联性数据 关联 单元获取 关联规则 计算单元 评估单元 第三方 多维 多源 脱敏 向量 评估 分析 合作 | ||
本发明提供的基于FP‑growth的多源数据关联隐私泄露风险评估系统,脆弱性分析单元获取待分析数据源,并对待分析数据源进行脆弱性分析,构建隐私数据库;关联分析单元使用FP‑growth关联分析算法对隐私数据库进行多维关联性数据分析,获取强关联规则;风险值计算单元结合脆弱性分析结果,计算隐私数据库中单一数据源的隐私泄露风险值;评估单元结合隐私泄露风险值构建风险评估体系;还用于利用风险评估体系,对隐私数据库中单一数据源进行多源隐私泄露风险评估,获得待分析数据源的风险向量,对该待分析数据源进行评估。该系统能够判断已脱敏数据交由第三方合作是否存在隐私泄露的风险。
技术领域
本发明属于隐私泄露风险评估技术领域,具体涉及基于FP-growth的多源 数据关联隐私泄露风险评估系统。
背景技术
已脱敏数据交由第三方进行合作时,第三方往往需要结合外部数据进行关 联分析。而外部数据与已脱敏数据将会产生新的数据组合方式,可能存在数据 泄密风险加大。例如第三方可能通过标示信息或者半标示信息,与外部数据进 行匹配,进而获取完整的用户信息。
发明内容
针对现有技术中的缺陷,本发明提供一种基于FP-growth的多源数据关联 隐私泄露风险评估系统,能够判断已脱敏数据交由第三方合作是否存在隐私泄 露的风险。
一种基于FP-growth的多源数据关联隐私泄露风险评估系统,包括:
脆弱性分析单元:用于获取待分析数据源,并对所述待分析数据源进行脆 弱性分析,构建隐私数据库;
关联分析单元:用于使用FP-growth关联分析算法对所述隐私数据库进行 多维关联性数据分析,获取强关联规则;
风险值计算单元:用于结合脆弱性分析结果,计算所述隐私数据库中单一 数据源的隐私泄露风险值;
评估单元:用于结合所述隐私泄露风险值构建风险评估体系;还用于利用 所述风险评估体系,对所述隐私数据库中单一数据源进行多源隐私泄露风险评 估,获得待分析数据源的风险向量,对该待分析数据源进行评估。
优选地,所述脆弱性分析单元具体用于:
对所述待分析数据源进行脆弱性分析;
结合预设的隐私类别,对经过脆弱性分析后的数据进行分类;
对分类后的数据进行数据格式处理,根据处理后的数据构建所述隐私数据 库。
优选地,所述关联分析单元具体用于:
创建FP-tree,并利用FP-growth算法挖掘所述FP-tree的频繁项集;
设置最小支持度阈值和最小置信度阈值;
根据所述最小支持度阈值和最小置信度阈值获得各个项集之间的强关联 规则。
优选地,所述关联分析单元具体用于:
对所述隐私数据库进行元素定义:定义I={i1,i2,...,im}为包含m个不同 项目ij的集合,称为项集;则隐私数据库D分为n个项集I,即 D={I1,I2,…,In},每个事务T为包含有若干个项集I的集合,即
扫描隐私数据库D,确定所述隐私数据库D中每个项集I的支持度,将频 繁项集按照支持度的递减排序,排序结果为结果L;
再次扫描隐私数据库D,构建FP-tree:创建FP-tree的根节点,标记为 null;对于每一个隐私数据库D中的每个事务T,选择事务T中的频繁项集, 并按照结果L中的次序进行排序;排序后的频繁项表记为[p|P],其中p是第 一个元素,P是剩余元素的表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优网科技有限公司,未经深圳市优网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910488174.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种气溶胶文献格式化数据库的构建方法
- 下一篇:一种数据管理系统和方法





