[发明专利]基于异方差差分和K-匿名机制的医疗数据隐私保护方法有效
| 申请号: | 201811206205.X | 申请日: | 2018-10-18 |
| 公开(公告)号: | CN111027090B | 公开(公告)日: | 2021-04-20 |
| 发明(设计)人: | 王英龙;孙宗锟;舒明雷;赵慧奇;崔焕庆;成曦;平永杰;燕婷 | 申请(专利权)人: | 山东科技大学;山东省计算中心(国家超级计算济南中心) |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G16H10/60;G06K9/62 |
| 代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 支文彬 |
| 地址: | 266590 山东省青岛*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 方差 匿名 机制 医疗 数据 隐私 保护 方法 | ||
1.一种基于异方差差分和K-匿名机制的医疗数据隐私保护方法,其特征在于,包括如下步骤:
a)处理医疗数据,将医疗数据中的数据标识符删除,把医疗数据中的离散属性用固定整数表示,将医疗数据全部数字化后得到原始医疗数据D’;
b)将原始医疗数据D’作为训练数据,利用python的scikit-learn库,构建CART决策树,通过pydot库将生成的决策树导出为dot文件,根据导出的dot文件计算CART决策树的树深度m,初始化CART决策树权重,CART决策树的第y层权重为m-y,最后一层权重为0,原始医疗数据D’中具有n个属性类型通过x1,x2,x3...xn表示,根据各类属性所在的CART决策树中的层数计算n个属性类型x1,x2,x3...xn所占初始权重X1,X2,X3...Xn;
c)根据公式将初始权重X1,X2,X3...Xn进行归一化,得到各属性类型的最终权重,式中min(X)为初始权重X1,X2,X3...Xn中的最小值,max(X)为初始权重X1,X2,X3...Xn中的最大值;
d)用户自定义K-anonymity机制的隐私参数K,将原始医疗数据D’中除标签外所有离散属性进行泛化处理,其中泛化处理的步骤为;
d-1)创建空的待泛化队列W,将原始医疗数据D’中除标签外所有离散属性加入待泛化队列W;
d-2)从待泛化队列W中选取一个待泛化的属性,依据选取的待泛化的属性对原始医疗数据D’进行属性泛化分裂,得到新的属性值组合;
d-3)对泛化分裂得到的新的属性值组合进行K-anonymity机制验证,如果每个新的属性值的数据数目均大于等于隐私参数K,则认为满足K-anonymity机制,将泛化后的数据保存至原始医疗数据D’,如果每个新的属性值的数据数目均小于隐私参数K,则认为泛化分裂失败,将步骤d-2)中选取的待泛化的属性从待泛化队列W中删除;
d-4)重复步骤d-2)和d-3),直至步骤d-2)中待泛化队列W中待泛化的属性全部逐一不重复的选取过;
d-5)保存泛化完的数据;
e)定义空集合A,将初始权重X1,X2,X3...Xn从小到大排列后映射到A集合中得到A1,A2,A3...An,定义A集合的中间点为Amdi、高权重分界点为As、低权重分界点为A1,令令当Xi≥As时,第i个属性的具体数值xi的取值范围为当Al≤Xi≤As时,第i个属性的具体数值xi的取值范围为当Xi≤Al时,第i个属性的具体数值xi的取值为xup为泛化后离散属性范围的上界,xdown为泛化后离散属性范围的下界;
f)根据各初始权重X1,X2,X3...Xn,对其数据整体进行差分隐私保护的异方差加噪操作,加噪操作如下:当Xi≥As时,当Al≤Xi≤As时,当Xi≤Al时,式中Lap为拉普拉斯噪声,Δf为差分隐私保护技术中定义的敏感度;
g)将加噪后的数据进行保存,记为医疗数据D-M;
h)将医疗数据D-M以1:2的比例划分测试集和训练集,将训练集放入利用tensorflow和pytorch搭建的深度神经网络模型中训练得到训练模型,再将测试集放入训练模型中得到预测标签,用得到的预测标签与测试集的原数据D’中的标签做对比,得到训练准确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学;山东省计算中心(国家超级计算济南中心),未经山东科技大学;山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811206205.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于均力免震法的玉米秸秆还田机
- 下一篇:一种多功能乡村建设监测系统





