[发明专利]训练模型用于对医学数据执行任务在审
| 申请号: | 202180049170.7 | 申请日: | 2021-07-08 |
| 公开(公告)号: | CN115803751A | 公开(公告)日: | 2023-03-14 |
| 发明(设计)人: | R·B·帕蒂尔;C·库尔卡尼;D·迈索尔·西杜;M·Y·潘迪亚 | 申请(专利权)人: | 皇家飞利浦有限公司 |
| 主分类号: | G06N3/02 | 分类号: | G06N3/02 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
| 地址: | 荷兰艾恩*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 训练 模型 用于 医学 数据 执行 任务 | ||
根据一个方面,提供了一种训练模型的方法,用于使用分布式机器学习过程对医学数据执行任务,由此全局模型基于在多个临床站点处对模型的本地副本所执行的训练而被更新。该方法包括:a)向多个临床站点发送(302)信息,以使得多个临床站点中的每个临床站点能够创建模型的本地副本,并且根据在相应的临床站点处的训练数据训练相应的模型的本地副本。然后,该方法包括b)从多个临床站点中的每个临床站点接收(304):i)对模型中的参数的本地更新,该本地更新是通过根据在相应的临床站点处的训练数据训练模型的本地副本而被获得,以及ii)与在相应的临床站点处所执行的训练的质量相关的元数据;以及c)基于所接收的对参数的本地更新和所接收的元数据,更新(306)全局模型中的参数。
技术领域
本文的实施例涉及使用分布式机器学习过程来训练模型。
背景技术
从大量患者数据中学习可以极大地增加生成和测试关于医疗保健的假设的能力。为了捕获和使用在大量患者数据中包含的知识,使用了预测模型。可以使用机器学习过程对来自先前已接受治疗的患者的大量数据来训练模型。以这种方式训练的模型具有被用来在诸如图像分割和诊断之类的许多医学领域中进行预测的潜力。这种模型可以被用来更好地个性化医疗保健。
通过使用利用机器学习过程所训练的模型来实现个性化医学的主要障碍之一是获得充足的患者数据来训练模型。来自仅一家医院的数据不可能足以开发可以被用于种类繁多的患者(例如,可以遍布全球)的模型。然而,要从不同的医院和患者群体得到数据可能会花费很长的时间,而这增加了模型的从规划到部署的时间。在深度学习领域中,模型的性能随着训练数据样本数目的增加而提高。因此,为了确保最佳可能的模型来帮助医生,可以用更多的数据主动地改善模型的性能。然而,由于与数据共享相关联的伦理、法律、政治和行政障碍,组合源自多个临床站点(clinical site)(例如,医院、医生的手术室等)的数据可能很困难。缓解这种问题的一种方式是通过使用分布式机器学习过程来训练模型,诸如例如在Bonawitz等人于2019年的题为“面向大规模的联合学习:系统设计(TowardsFederated Learning at Scale:System Design)”的论文中所描述的联合学习过程。分布式学习使得模型能够使用来自不同临床站点的数据来被训练,而不用数据离开该场所。
发明内容
如上面所指出,分布式机器学习过程可以被用来对位于不同站点的训练数据训练模型(或者称为“机器学习模型”),而不需要将训练数据从相应站点移动。本领域技术人员将熟悉诸如联合机器学习之类的分布式学习和分布式学习过程,然而,这在图1中简要示出,图1示出了与多个临床站点104至112通信的中央服务器102。中央服务器使用分布式学习过程,使用位于每个临床站点104到112的训练数据来协调模型的训练。中央服务器保存模型的“全局(global)”或中央副本,并且可以向每个临床站点发送114关于全局模型的信息,例如诸如使得能够创建模型的本地副本的参数。然后,每个临床站点可以创建模型的本地副本,并根据在相应的临床站点的训练数据训练其本地副本。然后,每个临床站点104到112可以向中央服务器发送116对模型的一个或多个参数的更新。中央服务器组合来自相应的临床站点的更新,例如通过平均来更新全局模型。这允许基于多个临床站点104到112处的训练数据来训练中央服务器102处的全局模型,例如更新和改进,而数据不必离开相应的临床站点。本文的实施例的目的是改进用于训练模型的此类过程以使用分布式机器学习过程对医学数据执行任务。
因此,根据第一方面,提供了一种训练模型的方法,用于使用分布式机器学习过程对医学数据执行任务,由此全局模型基于在多个临床站点处对模型的本地副本所执行的训练而被更新。该方法包括:a)向多个临床站点发送信息,以使得多个临床站点中的每个临床站点能够创建模型的本地副本,并且根据在相应的临床站点处的训练数据训练模型的相应的本地副本;b)从多个临床站点中的每个临床站点接收i)对模型中的参数的本地更新,该本地更新是通过根据在相应的临床站点处的训练数据训练模型的本地副本而获得的,以及ii)与在相应的临床站点处所执行的训练的质量相关的元数据;以及c)基于所接收的对参数的本地更新和所接收的元数据,更新全局模型中的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180049170.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于确定电容式电压互感器的状态的方法和装置
- 下一篇:粘合剂涂敷系统





