[发明专利]基于动态神经网络的医疗隐私数据识别方法在审
| 申请号: | 202111509434.0 | 申请日: | 2021-12-10 |
| 公开(公告)号: | CN114169007A | 公开(公告)日: | 2022-03-11 |
| 发明(设计)人: | 朱笑岩;张琳杰;冯鹏斌;马建峰 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;G16H10/60;G16H50/70;H04L9/00 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
| 地址: | 710071*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 动态 神经网络 医疗 隐私 数据 识别 方法 | ||
本发明公开了一种基于动态神经网络的医疗隐私数据识别方法,主要解决现有识别方法隐私泄露多、数据可用性低的问题。其方案是:采集原始数据、目标数据,从原始数据中选易受攻击数据,将噪声加入易受攻击数据得到差分隐私数据;根据差分隐私数据计算特征数据;根据特征数据计算参考数据;将目标数据加到参考数据中得到联合数据,根据联合数据计算标记数据;对标记数据按比例抽取组成训练样本集、测试样本集和验证样本集;搭建一个动态神经网络,利用训练样本集和测试样本集对该网络进行训练;将验证样本集输入到训练好的该网络中,获得医疗隐私数据识别结果。本发明能够减少隐私泄露,提升数据可用性,可用于数据脱敏、基因诊断、疾病预防。
技术领域
本发明属于安全网络技术领域,更进一步涉及一种医疗隐私数据识别方法,可用于数据脱敏、基因诊断、疾病预防。
背景技术
医疗数据只有经过分析处理,才能将其中对于疾病的诊断、治疗和医学研究方面有价值的知识和规则挖掘出来,从而帮助进行基因工程、疾病治疗、病群特性的研究。然而,医疗数据作为个体最主要的识别符,其包含了大量的个人隐私敏感信息,比如某种疾病倾向和家族病史信息,故医疗数据的使用引起了广泛的隐私关注。医疗数据利用的局限主要体现在两个方面,一是医疗数据利用的安全性取决于攻击者所掌握的背景知识多少,二是无法提供一种严格的数学证明来衡量其隐私保护程度。医疗隐私数据识别是一个非常关键的研究课题。当攻击者得到带噪声的数据后,需要有效的技术限制攻击者对原数据的推导能力,使得攻击者无法通过观察计算结果而获取准确的个体信息。另外,医疗隐私数据也存在非独立同分布的情况,其全局表征程度也影响结果的准确性。医疗隐私数据识别可以应用于数据脱敏,支持敏感数据自动发现并生成数据字典,保留原数据关系,提升医疗数据共享安全性和可用性。医疗隐私数据识别也可用于基因诊断,可以对正常用户的医疗数据进行有效保护和利用,从而避免了隐私泄露和昂贵加密技术的使用,具有更高的安全性、更高效的动态数据管理性能。医疗隐私数据识别还可用于疾病预防,识别个人身份的关键信息,通过对隐私信息加密匿名化存储,从而减少隐私泄露程度。
钟爱健康科技(广东)有限公司在申请号为202110422402.0的专利申请文献公开了“一种基于联邦学习张量因子分解的医疗隐私数据保护方法”。其实施步骤是:首先,各个医疗机构需维护本地分解的张量因子矩阵和全局张量非病患因子矩阵,并在联邦过程开始时对其进行初始化;其次,各个医疗机构进行本地的张量因子分解训练,通过利用损失函数进行梯度下降;然后,根据本地分解的因子矩阵和全局非病患因子矩阵求出对应的因子矩阵更新梯度。该方法由于攻击者可以在联邦过程中获得医疗隐私数据标签和结构,甚至可以很容易地从参数服务器中下载目标模型的参数,从而导致医疗隐私数据的泄露程度变大。
武汉大学在申请号为202010510983.9的专利申请文献公开了“一种医疗自相关时序数据差分隐私发布方法”。其实施步骤是:首先,构建个人医疗时序数据;其次,将个人医疗时序数据通过设定的滑动窗口划分为多个互不相交且等长的个人医疗时序数据子序列;然后,根据子序列计算得到该子序列归一化后的自相关函数,并根据查询函数计算得到该子序列的周期敏感度;最后产生与子序列对应的拉普拉斯噪声序列,并将所有噪声序列拼接得到子序列对应的拉普拉斯噪声序列,将其与原始时序数据相加得到最终要发布的结果。该方法由于将拉普拉斯噪声序列与原始时序数据相加得到最终要发布的结果,造成在单独使用差分隐私技术时会引入大量的噪声,数据失真程度变大,全局训练精度降低,数据的可利用性变小。
发明内容
本发明的目的在于针对上述现有技术的不足,提出一种基于动态神经网络的医疗隐私数据识别方法,以抵御成员推理攻击,在提高全局训练精度的同时进一步保护数据隐私,并在实现低隐私泄露的基础上提高医疗隐私数据的可用性。
本发明的技术关键是:采集医疗数据,计算特征数据,计算参考数据,利用联邦学习进行训练,构建动态神经网络,训练动态神经网络,得到隐私数据识别结果,其实现方案包括如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111509434.0/2.html,转载请声明来源钻瓜专利网。





