[发明专利]一种多重生存终端结果联合分析的方法有效
申请号: | 201910352169.6 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110085324B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 李嘉路;华芮 | 申请(专利权)人: | 深圳市华嘉生物智能科技有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F18/2431;G06F18/2415 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 谭穗平 |
地址: | 518067 广东省深圳市南山区招*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多重 生存 终端 结果 联合 分析 方法 | ||
本发明公开了一种多重生存终端结果联合分析的方法,属于医学统计学领域,可帮助研究者解决无法联合分析临床试验中生成的二值类和生存时间类因变量数据的难题。该发明在使用决策树和随机森林的框架下,提出了一个新型的复合分叉标准,以此整合不同类型因变量之间的相关性信息,从而达到预测各因变量、筛选重要自变量的技术目的。模拟实验表明,如果各因变量之间存在相关性,相比单因变量分析而言,本发明的多重输出分析方法可显著提高二值类和生存分析类囚变量的预测准确度,且在筛选重要特征时具备一定的优势。本发明可用于高维临床数据的联合终端结果分析,也可用于药物或新治疗反应机制的前期探究性研究。
技术领域
本发明属于医学统计学领域,具体涉及了一种可联合分析二值类和生存时间类临床病人终端结果的方法。
背景技术
在临床肿瘤学药物研发或者新治疗方法的探索研究中,研究者通常会从病人身上采集大量的自变量(independent variable)数据(有时也称之为特征数据),其中包括分子水平的数据:如基因体突变(somatic mutation)频率、信使RNA(mRNA)表达水平、蛋白质表达水平等,细胞水平的数据:如实体肿瘤穿刺样品HE染色病理学切片图片、免疫组化(IHC)染色图片等,和宏观水平数据:如计算机断层扫描(Computed Tomography,CT)、核磁共振(Magnetic Resonance Imaging,MRI)等影像图片。研究者可在试验中的多个时间点采集这些数据,从而进一步扩大了数据量的规模。另外一方面,临床试验会评估病人对药物或新治疗方法的反应,此类反应主要基于病人的终端结果(endpoint)数据,包括二值类终端结果(binary outcome):如最佳疗效(best overall response,BOR)、深度病理缓释(majorpathological response,MPR),和连续型的生存时间终端结果(survival outcome):如无疾病进展生存时间(progression-free survival,PFS)、总体生存时间(overallsurvival,OS)。这些数据有时也称之为因变量(dependent variable)数据。基于这些数据,研究者希望能够寻找到一组关键的生物标志物,可以用来同时预测多种类型的临床终端结果。
那么为什么需要联合分析,而不是以单独的临床终端结果做分析?其主要原因在于联合分析既可以提高预测的准确度,也可以寻找到真正的关键标志物。如图(图1)所示,假设有一个未知的机制在驱动两种类型的终端结果,那么在预测层面上,联合预测由于整合了多重终端结果之间的相关性信息,理论上相比单终端结果预测会有更好的预测准确度。在特征/生物标志物筛选层面上,由于单终端结果分析在筛选阈值附近生物标志物时会受到噪音影响,此影响会在简单整合多个单终端结果分析时进一步扩大,最终导致相关的标志物未被选取。如图(图2)所示例,蛋白质B在单终端结果分析中均未被选取,而联合分析由于考虑到各特征与两类终端结果的相关性,会有更大的可能正确选取蛋白质B作为关键标志物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华嘉生物智能科技有限公司,未经深圳市华嘉生物智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910352169.6/2.html,转载请声明来源钻瓜专利网。