[发明专利]数据去标识化方法、装置、设备及存储介质在审
| 申请号: | 202010110562.7 | 申请日: | 2020-02-24 |
| 公开(公告)号: | CN110955673A | 公开(公告)日: | 2020-04-03 |
| 发明(设计)人: | 孙同乐 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
| 主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/27;G06F16/172;G06F16/18;G06F16/182;G06F21/62;G16H10/60 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海;袁礼君 |
| 地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 标识 方法 装置 设备 存储 介质 | ||
本发明公开一种数据去标识化方法、装置、设备及存储介质。该方法包括:当源端服务器发生数据更新并生成数据库日志文件时,目标服务器接收所述源端服务器主动推送的所述数据库日志文件;当所述目标服务器接收到所述源端服务器发送的所述数据库日志文件后,所述目标服务器基于预配置的应用进程,对所述数据库日志文件进行解析以解析出所述数据库日志文件中的标识化数据,对所述标识化数据进行去标识化处理,并将去标识数据存入所述目标服务器的目标数据库中。根据本发明提供的数据去标识化方法,能够在数据应用之前完成大数据量的同步存储及去标识,无需对应用程序进行去标识化配置,有效地节约了开发成本。
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据去标识化方法、装置、电子设备及计算机可读存储介质。
背景技术
近年来,随着信息技术的快速发展,大数据实现共享的同时带来了个人隐私泄露等信息安全问题。例如,医疗机构间共享含有患者姓名、电话、证件号码等信息的原始医疗数据,过程中一旦发生泄漏或被非法窃取,将给患者的健康和财产带来巨大损失,甚至危及国家安全。
因此,目前的大数据应用场景对于数据去标识化的需求愈发强烈。现阶段的去标识化进程通常在应用层执行,然而在应用程序的基础上进行去标识配置的难度极大,需要大量修改程序代码。再者,应用程序尚无法在接收大数据量的同时对其完成同步去标识。
需要说明的是,在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种数据去标识化方法、装置、电子设备及计算机可读存储介质。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的一方面,提供一种数据去标识化方法,包括:当源端服务器发生数据更新并生成数据库日志文件时,目标服务器接收所述源端服务器主动推送的所述数据库日志文件;当所述目标服务器接收到所述源端服务器发送的所述数据库日志文件后,所述目标服务器基于预配置的应用进程,对所述数据库日志文件进行解析以解析出所述数据库日志文件中的标识化数据,对所述标识化数据进行去标识化处理,并将去标识数据存入所述目标服务器的目标数据库中。
根据本发明的一实施方式,所述目标服务器基于预配置的应用进程,对所述数据库日志文件进行解析以解析出所述数据库日志文件中的标识化数据包括:所述目标服务器基于预配置的第一应用进程,对所述数据库日志文件中的所述源端服务器的更新数据是否包括标识化数据进行识别;当识别出所述更新数据包括标识化数据时,所述目标服务器基于预配置的第二应用进程,解析出所述标识化数据。
根据本发明的一实施方式,在将去标识数据存入所述目标服务器的目标数据库中之后,所述方法还包括:所述目标服务器接收终端的操作指令;所述目标服务器根据所述操作指令,将所述操作指令对应的去标识数据发送给所述终端。
根据本发明的一实施方式,对所述标识化数据进行去标识化处理包括:对所述标识化数据进行脱敏处理,获得所述标识化数据对应的脱敏数据;以及对所述脱敏数据进行去标识化处理,获得所述标识化数据对应的去标识数据。
根据本发明的一实施方式,对所述标识化数据进行脱敏处理,获得所述标识化数据对应的脱敏数据包括:基于预设的脱敏规则,对所述标识化数据进行数据变形处理,以获得所述脱敏数据。
根据本发明的一实施方式,对所述脱敏数据进行去标识化处理,获得所述标识化数据对应的去标识数据包括:根据所述标识化数据的类型,基于不同的去标识化规则,对所述标识化数据进行去标识化处理。
根据本发明的一实施方式,当所述标识化数据的类型为患者ID(IdentityDocument,身份标识号)时,在对所述标识化数据进行去标识化处理之前,所述方法还包括:校验所述患者ID的有效性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010110562.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





