[发明专利]基于因果推断的竞争风险生存分析方法在审
| 申请号: | 202210085862.3 | 申请日: | 2022-01-25 |
| 公开(公告)号: | CN114418420A | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 黄正行;洪草根;易帆 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 高明翠 |
| 地址: | 310012 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 因果 推断 竞争 风险 生存 分析 方法 | ||
本发明公开了一种基于因果推断的竞争风险生存分析方法,包含:根据竞争风险生存分析模型搭建结构化因果模型;根据结构化因果模型识别竞争风险生存分析模型中存在的混淆因子以及混淆因子产生的后门路径;通过后门调整对竞争风险生存分析模型进行因果干预以去除模型中的混淆因子;定义竞争风险生存分析模型的损失函数,并对其进行修正得到因果干预后的损失函数;对因果干预后的损失函数进行最小化以实现对竞争风险生存分析模型的训练优化。本发明的基于因果推断的竞争风险生存分析方法,通过用结构化因果模型从因果角度来修正现有的竞争风险生存分析模型,采用因果推断的方式,通过后门调整公式来学习一个去偏差的生存模型。
技术领域
本发明属于数据处理领域,具体涉及一种基于因果推断的竞争风险生存分析方法。
背景技术
生存分析是一系列数据分析技术的集合,其目标是分析协变量与感兴趣事件的命中时间之间的关系。生存分析方法包括统计方法到机器学习,以及近年来的深度学习方法。各种生存分析方法如今已广泛应用于各个领域,包括医学、推荐系统和经济学等。
传统的统计生存分析方法,例如Cox比例风险模型(CPH),虽然取得了巨大的成功,但缺乏处理竞争风险问题的能力,即存在多个感兴趣事件的环境。竞争风险是一类事件,它要么阻碍对感兴趣事件的观察,要么改变该事件发生的可能性,因此在估计生存时间中起着至关重要的作用。为了解决生存分析中的竞争风险问题,Fine和Gray首先于1999年提出了基于竞争风险的统计学生存分析模型,Fine-Gray模型,和近年来提出的深度学习模型,例如DeepHit模型及其基于动态生存分析的变体(Dynamic DeepHit),并且相关文献已经证明了这些模型在下游任务中的可行性。
尽管取得了很多进展,但现有的竞争风险的生存分析模型存在一个重大缺陷,即竞争风险是混杂因素,在捕获协变量和感兴趣事件之间因果关系时,会误导生存分析模型学习协变量X和事件Y之间的虚假相关性,导致模型的性能降低。尽管混杂因素有利于通过模型计算P(Y|X)捕获X和Y之间的基本关系,但它可能会错误地提取与事件无关,以及不提取与事件相关的协变量。
发明内容
本发明提供了一种基于因果推断的竞争风险生存分析方法解决上述提到的技术问题,具体采用如下的技术方案:
一种基于因果推断的竞争风险生存分析方法,包含:
根据竞争风险生存分析模型搭建结构化因果模型;
根据结构化因果模型识别竞争风险生存分析模型中存在的混淆因子以及混淆因子产生的后门路径;
通过后门调整对竞争风险生存分析模型进行因果干预以去除模型中的混淆因子;
定义竞争风险生存分析模型的损失函数,并对其进行修正得到因果干预后的损失函数;
对因果干预后的损失函数进行最小化以实现对竞争风险生存分析模型的训练优化。
进一步地,搭建结构化因果模型的具体方法为:
将协变量X、竞争风险R、潜在表征C、发生事件Y和发生时间T作为节点,通过带有箭头的线段连接上述节点,其中,箭头的方向表示节点间的因果关系。
进一步地,在结构化因果模型中:
X→C表征学习过程;
X→Y←C表示生存分析过程;
X→R←Y表示后门路径;
R→X表示竞争风险R导致相应对象的协变量X发生变化;
R→Y表示最终发生的事件来自竞争风险R。
进一步地,混淆因子为竞争风险R,竞争风险R为竞争事件的集合其表示研究对象i的一组竞争风险,每个表示对象i的一个竞争风险。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210085862.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





