[发明专利]跨组织边界地利用医学数据在审
| 申请号: | 202111011828.3 | 申请日: | 2021-08-31 |
| 公开(公告)号: | CN114116860A | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 阿斯米尔·沃登查雷维奇 | 申请(专利权)人: | 西门子医疗有限公司 |
| 主分类号: | G06F16/25 | 分类号: | G06F16/25;G16H40/20 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 丁永凡;支娜 |
| 地址: | 德国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 组织 边界 利用 医学 数据 | ||
1.一种用于利用医学数据集(MD)的计算机实施的方法,其中
所述医学数据集(MD)在本地存储在第一机构(A)之内并且具有多个原始的单数据集(RDS1...RDS6),所述原始的单数据集与真实存在的患者相关联并且具有关于一个或多个上级变量(x,y)的原始值;并且所述方法具有以下步骤:
基于所述医学数据集(MD)产生(S20)合成数据集(SD),其中所述合成数据集(SD)具有多个合成的单数据集(SDS),这些合成的单数据集具有关于与所述医学数据集(MD)相同的上级变量(x,y)的合成值,但是不能够追溯到原始存在的患者,其中产生(S20)的步骤在本地在所述第一机构(A)之内通过将采样函数(DSF)应用于所述医学数据(MD)来进行;
将所述合成数据集(SD)从所述第一机构(A)传送(S30)给在所述第一机构(A)外的中央单元(100);以及
在所述中央单元(100)之内利用(S40)所述合成数据集(SD)。
2.根据权利要求1所述的方法,其中
所述采样函数(DSF)构成用于在替代所有原始值的情况下通过对整个医学数据集(MD)采样来产生所述合成数据集(SD)。
3.根据上述权利要求中任一项所述的方法,其中
所述采样函数(DSF)具有经训练的函数。
4.根据上述权利要求中任一项所述的方法,其中
所述采样函数(DSF)具有k-最近邻算法。
5.根据上述权利要求中任一项所述的方法,其中:
在所述医学数据集(MD)中定义多个数据类别并且每个原始的单数据集(RDS1...RDS6)与一个数据类别相关联;以及
在产生(S20)的步骤中,将所述采样函数(DSF)单独应用于所述数据类别中的每个数据类别,使得对于每个数据类别仅基于与所述数据类别相关联的原始的单数据集(RDS1...RDS6)产生合成数据集(SDS)。
6.根据上述权利要求中任一项所述的方法,其中利用(S40)的步骤包括:
基于所述合成数据集(SD)训练用于预测临床结果的可训练的分类器;和/或
基于所述合成数据集(SD)验证用于预测临床结果的可训练的分类器;和/或
统计学地评估所述合成数据集(SD);和/或
将所述合成数据集(SD)存档在所述中央单元(100)中。
7.根据上述权利要求中任一项所述的方法,所述方法还具有如下步骤:
在所述第一机构(A)中提供(S21)采样函数(DSF),所述采样函数(DSF)构成用于产生所述合成数据集(SD)。
8.根据上述权利要求中任一项所述的方法,其中
所述合成数据集(SD)中的合成的单数据集(SDS)的数量大于所述医学数据集(MD)中的原始的单数据集的数量。
9.根据上述权利要求中任一项所述的方法,所述方法还具有如下步骤:
计算(O30)质量泛函,所述质量泛函是代表所述合成数据集(SD)的统计学特性与所述原始数据集(MD)的统计学特性的一致性的尺度。
10.根据权利要求9所述的方法,其中
通过优化所述质量泛函对于所述医学数据集(MD)优化所述采样函数(DSF)的至少一个参数(k)(O10-O40)。
11.根据权利要求10所述的方法,其中所述优化包括:
为所述参数(k)定义(O10)多个选择值;
为多个选择值中的每个选择值各产生(O20)一个合成数据集(SD),其中相应的选择值用作为用于所述采样函数(DSF)的待优化的参数(k)的值;
为每个所产生的合成数据集(SD)计算(O30)所述质量泛函;
比较(O40)计算出的质量泛函;以及
基于所述比较为待优化的参数(k)选择(O50)最优的选择值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子医疗有限公司,未经西门子医疗有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111011828.3/1.html,转载请声明来源钻瓜专利网。





