[发明专利]利用血浆游离核酸检测癌症的深度学习方法和系统有效
申请号: | 202110021990.7 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112820407B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 汪小我;李嘉琦;魏磊 | 申请(专利权)人: | 清华大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/20;G16B20/20;G16B20/50;G16B20/30;G16B30/00;G16B40/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 李岩 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 血浆 游离 核酸 检测 癌症 深度 学习方法 系统 | ||
本发明公开了一种利用血浆游离核酸检测癌症的深度学习方法和系统,其中,方法包括以下步骤:通过使用核酸分子级别分辨率的甲基化状态数据定义癌症特异的差异甲基化区间,从而达到富集分子分辨率级别的信息的效果;使用深度学习模型整合核酸分子的序列信息以及甲基化信息从而达成精确的核酸分子来源预测;通过计算最大后验概率的方式估计血浆中来自癌症的核酸序列片段占比,从而起到癌症的非侵入式辅助诊断的效果。将本发明的方法应用于癌症检测中,能够在非常低深度的测序数据上达到稳定的预测效果,从而在降低检测成本的同时保证足够的灵敏性与准确性。
技术领域
本发明涉及生物信息与医疗技术领域,特别涉及一种利用血浆游离核酸检测癌症的深度学习方法和系统。
背景技术
在生物体内,伴随着细胞凋亡等过程,细胞内的DNA片段会被释放到血浆中成为游离DNA(cell-free DNA,简称cfDNA)。在癌症发生早期,当患者还未表现出明显的临床症状时,细胞内DNA的状态就已经发生了变化,这些DNA被释放到血浆中,使得血浆cfDNA蕴含了与癌症相关的信息。通过对这些信息进行提取和处理,即可对癌症进行非侵入式诊断,实现癌症的早诊早治。
目前癌症cfDNA相关研究的主流思路是利用cfDNA上与癌症相关的单基因或少数基因的突变推断癌症的发生。然而,cfDNA本质上是一个信噪比较低的混合信号,在癌症发生早期癌cfDNA比例极低,影响基因突变的检出率;此外,由于癌症突变的异质性很强,不同的个体发生突变的位点很可能不同,限制了该技术的进一步应用。此外,对cfDNA片段的整体性质进行统计和分析,例如拷贝数变异,片段化模式等也可以反映出癌症发生的相关信息,但是由于这些信号噪声较大,在癌症发生早期的诊断准确率较为有限。对比而言,DNA甲基化由于在癌症发生早期即会在全基因组水平上发生较为显著的变化,被认为是一种具有癌症早筛应用潜力的基因组特征。
通过使用全基因组甲基化测序(WGBS)技术,可以同时获得血浆中cfDNA的序列信息以及甲基化状态信息,使用深度学习模型,能够将这样高精度的信息进行整合,从而实现高精度的序列来源预测,并根据预测结果进行癌症信号的检测以及癌症的非侵入式筛查。
然而,现有的基于单条读段(read)的癌症检测方式并没有充分利用序列信息,这使得序列的来源预测准确程度不足,尤其在低测序深度下表现不够稳定,亟待解决。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种利用血浆游离核酸检测癌症的深度学习方法,通过使用深度学习对数据的整合能力与对大量数据的分析能力,实现对血浆中cfDNA序列来源的预测,实现高精度的非侵入式癌症早期检测。
本发明的另一个目的在于提出一种利用血浆游离核酸检测癌症的深度学习系统。
为达到上述目的,本发明一方面实施例提出了一种利用血浆游离核酸检测癌症的深度学习方法,包括以下步骤:使用核酸分子级别分辨率的甲基化状态数据定义癌症特异的差异甲基化区间,并从所述差异甲基化区间筛选得到富集分子分辨率级别的信息;使用深度学习模型整合所述信息中核酸分子的序列信息和甲基化信息,并根据整合后的信息预测核酸分子来源;计算所述核酸分子来源的最大后验概率,根据所述最大后验概率估计血浆中来自癌症的核酸序列片段占比,以根据所述占比确定癌症的风险结果。
本发明实施例的利用血浆游离核酸检测癌症的深度学习方法,使用深度学习模型判断血浆中游离核酸分子组织来源以及根据预测结果进行癌症检测,从而能够在非常低深度的测序数据上达到稳定的预测效果,在降低检测成本的同时保证足够的灵敏性与准确性。
另外,根据本发明上述实施例的利用血浆游离核酸检测癌症的深度学习方法还可以具有以下附加的技术特征:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110021990.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:天线组件及电子设备
- 下一篇:一种天然人造混合草皮及其制备方法