[发明专利]一种数据共享策略下的多中心协同预后预测系统有效

专利信息
申请号: 201910629800.2 申请日: 2019-07-12
公开(公告)号: CN110348241B 公开(公告)日: 2021-08-03
发明(设计)人: 李劲松;李谨;田雨;吴承凯;池胜强 申请(专利权)人: 之江实验室
主分类号: G06F21/62 分类号: G06F21/62;G06K9/62;G16H10/60
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 刘静
地址: 310023 浙江省杭州市余*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 共享 策略 中心 协同 预后 预测 系统
【权利要求书】:

1.一种数据共享策略下的多中心协同预后预测系统,其特征在于,包括:

(1)数据获取模块:在各医疗机构中心分别收集患者预后预测所需要的各个变量的数据,作为该医疗机构中心的源数据集;

(2)数据匿名化模块:对每个医疗机构中心的源数据集以50%进行随机采样,对采样数据使用匿名化算法生成匿名化数据,剩余数据作为该医疗机构中心的本地训练集;来自每个医疗机构中心的匿名化数据由中央服务器收集合成增强数据集;将增强数据集分成两部分,即附加训练集和验证集;附加训练集用于回传并分配给每个医疗机构中心;验证集用于选择集成学习模型的超参数(hyper parameter);所述匿名化算法可选择k-匿名算法(k-anonymity)、l-多样性(l-diversity)、t-临近度(t-closeness)以及差分隐私匿名算法;其中具体用于实现k-匿名的方法可以选择抑制(suppression),抑制即彻底隐藏某些信息,不发布某些数据项;

(3)模型训练模块:每个医疗机构中心在本地训练集成学习模型的子分类器,在训练过程中的训练数据包括该医疗机构中心的本地训练集和中央服务器回传给该医疗机构中心的附加训练集;这表明用于训练每个医疗机构中心子分类器的训练集不仅来自中心本身还来自其他中心的数据集,从而增加数据集的随机性,以提高集成学习模型的整体性能, 在训练过程中,利用从增强数据集创建的验证集选择集成学习模型的超参数;

(4)预后模型应用模块:由中央服务器收集各医疗机构中心本地训练的子分类器构成完整的集成学习模型;将新的患者数据输入该集成学习模型执行预后预测。

2.根据权利要求1所述的一种数据共享策略下的多中心协同预后预测系统,其特征在于,该系统考虑水平分割数据(horizontal-partitioned data),即每个医疗机构中心的源数据集具有相同种类的变量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910629800.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top