[发明专利]一种数据共享策略下的多中心协同预后预测系统有效
申请号: | 201910629800.2 | 申请日: | 2019-07-12 |
公开(公告)号: | CN110348241B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 李劲松;李谨;田雨;吴承凯;池胜强 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62;G16H10/60 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种数据共享策略下的多中心协同预后预测系统。该系统能够在多个医疗机构中心下实现隐私保护的数据共享,从而为模型构建提供足够的数据。本发明采用相对于弱分类器能够获得更好预测结果的集成学习算法来构建系统。该系统在各个中心处理敏感的患者级数据,并同时构建出集成学习模型的子分类器,仅交换不太敏感的中间结果以构建完整的集成学习模型,从而保证了所提出的多中心模型与集中式模型具有相同甚至更优的结果。本发明多中心协同预后预测系统保护了患者的个人隐私,不需要在大型集中式数据源上运行算法模型,在实际临床应用中,为单个医疗机构中构建预测模型的样本太少提供了可靠的解决方案。 | ||
搜索关键词: | 一种 数据 共享 策略 中心 协同 预后 预测 系统 | ||
【主权项】:
1.一种数据共享策略下的多中心协同预后预测系统,其特征在于,包括:(1)数据获取模块:在各医疗机构中心分别收集患者预后预测所需要的各个变量的数据,作为该医疗机构中心的源数据集。(2)数据匿名化模块:对每个医疗机构中心的源数据集以百分比p进行随机采样,对采样数据使用匿名化算法生成匿名化数据,剩余数据作为该医疗机构中心的本地训练集;来自每个医疗机构中心的匿名化数据由中央服务器收集合成增强数据集;将增强数据集分成两部分,即附加训练集和验证集;附加训练集用于回传并分配给每个医疗机构中心;验证集用于选择集成学习模型的超参数(hyper parameter)。(3)模型训练模块:每个医疗机构中心在本地训练集成学习模型的子分类器,在训练过程中的训练数据包括该医疗机构中心的本地训练集和中央服务器回传给该医疗机构中心的附加训练集;这表明用于训练每个医疗机构中心子分类器的训练集不仅来自中心本身还来自其他中心的数据集,从而增加数据集的随机性,以提高集成学习模型的整体性能。在训练过程中,利用从增强数据集创建的验证集选择集成学习模型的超参数。(4)预后模型应用模块:由中央服务器收集各医疗机构中心本地训练的子分类器构成完整的集成学习模型;将新的患者数据输入该集成学习模型执行预后预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910629800.2/,转载请声明来源钻瓜专利网。
- 上一篇:复印机离线数据提取解析方法及装置
- 下一篇:业务请求处理方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置