[发明专利]数据处理方法、装置、电子设备及可读存储介质在审
申请号: | 201911300117.0 | 申请日: | 2019-12-16 |
公开(公告)号: | CN111079179A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 付莉珺 | 申请(专利权)人: | 北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 唐正瑜 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 可读 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取多个用户中每个用户对应的用户数据集,所述用户数据集包括对应的用户在各个不同个人属性中的个人数据,所述个人属性包括敏感属性和多个准标识符属性;
确定各个用户对应的用户数据集中每个准标识符属性对应的目标数据和所述敏感属性对应的敏感数据;
基于所述目标数据和所述敏感数据,确定每个所述准标识符属性和所述敏感属性之间的关联程度;
根据所述关联程度确定对所述多个准标识符属性进行K-匿名处理的泛化顺序。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标数据和所述敏感数据,确定每个所述准标识符属性和所述敏感属性之间的关联程度,包括:
计算并获得每个所述目标数据和所述敏感数据之间的关联系数;
根据多个所述关联系数确定每个所述准标识符属性和所述敏感属性之间的关联程度。
3.根据权利要求2所述的方法,其特征在于,所述计算并获得所述目标数据和所述敏感数据之间的多个关联系数,包括:
采用灰色关联分析法计算并获得每个所述目标数据和所述敏感数据之间的关联系数。
4.根据权利要求2所述的方法,其特征在于,所述根据多个所述关联系数确定每个所述准标识符属性和所述敏感属性之间的关联程度,包括:
计算并获得多个所述关联系数的关联系数均值;
将所述关联系数均值确定为对应的准标识符属性和所述敏感属性之间的关联程度。
5.根据权利要求2所述的方法,其特征在于,所述计算并获得每个所述目标数据和所述敏感数据之间的关联系数之前,还包括:
对所述目标数据和所述敏感数据分别进行无量纲化处理,获得处理后的目标数据和敏感数据。
6.根据权利要求1所述的方法,其特征在于,所述确定各个用户对应的用户数据集中每个准标识符属性对应的目标数据,包括:
对所述多个准标识符属性进行筛选,获得所述用户数据集中剩余的至少两个准标识符属性;
确定各个用户对应的用户数据集中剩余的每个准标识符属性对应的目标数据。
7.根据权利要求6所述的方法,其特征在于,所述对所述多个准标识符属性进行筛选,获得所述用户数据集中剩余的至少两个准标识符属性,包括:
采用主成分分析法对所述多个准标识符属性进行筛选,获得所述用户数据集中剩余的至少两个准标识符属性。
8.根据权利要求1-7任一所述的方法,其特征在于,所述根据所述关联程度确定对所述多个准标识符属性进行K-匿名处理的泛化顺序,包括:
根据所述关联程度的大小顺序确定对所述多个准标识符属性进行K-匿名处理的泛化先后顺序。
9.根据权利要求1所述的方法,其特征在于,所述根据所述关联程度确定对所述多个准标识符属性进行K-匿名处理的泛化顺序,包括:
获取每个所述准标识符属性对应的目标数据的取值个数;
根据所述关联程度以及每个所述准标识符属性对应的目标数据的取值个数,确定对所述多个准标识符属性进行K-匿名处理的泛化顺序。
10.根据权利要求1所述的方法,其特征在于,所述根据所述关联程度确定对所述多个准标识符属性进行K-匿名处理的泛化顺序之后,还包括:
按照所述泛化顺序依次对所述多个准标识符属性进行泛化处理,直至总的泛化层次达到预设K值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司,未经北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911300117.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多点喷射燃气发动机及燃气混合器
- 下一篇:一种太阳能硅片切割液制备工艺