[发明专利]一种数据共享策略下的多中心协同预后预测系统有效
申请号: | 201910629800.2 | 申请日: | 2019-07-12 |
公开(公告)号: | CN110348241B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 李劲松;李谨;田雨;吴承凯;池胜强 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62;G16H10/60 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 共享 策略 中心 协同 预后 预测 系统 | ||
1.一种数据共享策略下的多中心协同预后预测系统,其特征在于,包括:
(1)数据获取模块:在各医疗机构中心分别收集患者预后预测所需要的各个变量的数据,作为该医疗机构中心的源数据集;
(2)数据匿名化模块:对每个医疗机构中心的源数据集以50%进行随机采样,对采样数据使用匿名化算法生成匿名化数据,剩余数据作为该医疗机构中心的本地训练集;来自每个医疗机构中心的匿名化数据由中央服务器收集合成增强数据集;将增强数据集分成两部分,即附加训练集和验证集;附加训练集用于回传并分配给每个医疗机构中心;验证集用于选择集成学习模型的超参数(hyper parameter);所述匿名化算法可选择k-匿名算法(k-anonymity)、l-多样性(l-diversity)、t-临近度(t-closeness)以及差分隐私匿名算法;其中具体用于实现k-匿名的方法可以选择抑制(suppression),抑制即彻底隐藏某些信息,不发布某些数据项;
(3)模型训练模块:每个医疗机构中心在本地训练集成学习模型的子分类器,在训练过程中的训练数据包括该医疗机构中心的本地训练集和中央服务器回传给该医疗机构中心的附加训练集;这表明用于训练每个医疗机构中心子分类器的训练集不仅来自中心本身还来自其他中心的数据集,从而增加数据集的随机性,以提高集成学习模型的整体性能, 在训练过程中,利用从增强数据集创建的验证集选择集成学习模型的超参数;
(4)预后模型应用模块:由中央服务器收集各医疗机构中心本地训练的子分类器构成完整的集成学习模型;将新的患者数据输入该集成学习模型执行预后预测。
2.根据权利要求1所述的一种数据共享策略下的多中心协同预后预测系统,其特征在于,该系统考虑水平分割数据(horizontal-partitioned data),即每个医疗机构中心的源数据集具有相同种类的变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910629800.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:复印机离线数据提取解析方法及装置
- 下一篇:业务请求处理方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置