[发明专利]基因焦点扩增分型模型的构建方法及肿瘤样本的分型方法在审
申请号: | 202211067952.6 | 申请日: | 2022-09-01 |
公开(公告)号: | CN115148287A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 徐瑞华;赵齐;王诗翔 | 申请(专利权)人: | 中山大学肿瘤防治中心(中山大学附属肿瘤医院;中山大学肿瘤研究所) |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G06K9/62;G16B40/20;G16H50/20 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 谢敏楠;贺英倩 |
地址: | 510060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因 焦点 扩增 模型 构建 方法 肿瘤 样本 | ||
本申请涉及一种基因焦点扩增分型模型的构建方法、肿瘤样本的分型方法、基因焦点扩增分型模型的构建装置、肿瘤样本的分型系统、计算机设备和存储介质。所述方法包括:获取预设数量肿瘤样本中各等位基因特异的第一关联特征样本数据;对各第一关联特征样本数据进行随机划分处理,生成训练样本集和测试样本集;根据训练样本集对预设的基因分型模型进行训练,并根据测试样本集对基因分型模型进行测试,基于训练和测试得到的PR‑AUC指标调整基因分型模型的模型参数,直至PR‑AUC指标符合预设要求,生成训练好的基因焦点扩增分型模型,以基于训练好的基因焦点扩增分型模型输出基因焦点扩增分型结果。采用本方法能够准确地预测基因是否载于ecDNA。
技术领域
本申请涉及生物信息智能处理技术领域,特别是涉及一种基因焦点扩增分型模型的构建方法、肿瘤样本的分型方法、基因焦点扩增分型模型的构建装置、肿瘤样本的分型系统、计算机设备和存储介质。
背景技术
体细胞基因组DNA的变异驱动肿瘤的产生和进展。染色体外环状DNA(extra-chromosomal DNA,ecDNA)在多种不同类型肿瘤细胞中广泛存在,而在正常细胞中几不可见,它是肿瘤细胞表达癌基因的主要来源,包含的癌基因转录活跃程度远大于染色体上相同的基因,而组成ecDNA的基因在不同肿瘤中各不相同。ecDNA拷贝高、转录活性强、且通过不均等分裂方式促进肿瘤异质性的产生,增强肿瘤对环境的适应能力,进一步推动肿瘤快速演化、治疗耐药,导致肿瘤患者的不良预后。
目前,ecDNA的研究对于肿瘤防治愈显重要。然而,传统技术中研究ecDNA的实用工具依然缺乏,导致无法准确的预测基因是否载于ecDNA。
发明内容
基于此,有必要针对上述技术问题,提供一种能够准确地预测基因是否载于ecDNA的基因焦点扩增分型模型的构建方法、肿瘤样本的分型方法、基因焦点扩增分型模型的构建装置、肿瘤样本的分型系统、计算机设备和存储介质。
第一方面,提供了一种基因焦点扩增分型模型的构建方法,上述构建方法包括:
获取预设数量肿瘤样本中各等位基因特异的第一关联特征样本数据;第一关联特征样本数据包括肿瘤样本中等位基因特异的绝对拷贝数信息;绝对拷贝数信息包括基因总拷贝、基因小等位基因拷贝、肿瘤纯度、肿瘤倍性、拷贝数变异负载、杂合性缺失比例、肿瘤异倍性评分和拷贝数变异模式的一种或多种;
对各第一关联特征样本数据进行随机划分处理,生成训练样本集和测试样本集;
根据训练样本集对预设的基因分型模型进行训练,并根据测试样本集对基因分型模型进行测试,基于训练和测试得到的PR-AUC指标调整基因分型模型的模型参数,直至PR-AUC指标符合预设要求,生成训练好的基因焦点扩增分型模型,以基于训练好的基因焦点扩增分型模型输出基因焦点扩增分型结果;基因焦点扩增分型结果包括基因载于染色体外环状DNA或基因载于染色体DNA。
在其中一个实施例中,第一关联特征样本数据还包括肿瘤样本中等位基因特异的扩增频率信息;扩增频率信息包括环形扩增频率、断裂桥循环扩增频率、复杂重排扩增频率和线性扩增频率中的一种或多种。
在其中一个实施例中,获取预设数量肿瘤样本中各等位基因特异的第一关联特征样本数据的步骤包括:获取预设数量肿瘤患者的第一目标基因测序结果;第一目标基因测序结果包括肿瘤患者的肿瘤样本的基因测序结果和对应的正常对照样本的基因测序结果;对各第一目标基因测序结果进行分析,得到对应的第一关联特征样本数据。
在其中一个实施例中,拷贝数变异模式包括19种拷贝数变异子模式和各拷贝数变异子模式对应的比例。
在其中一个实施例中,对各第一目标基因测序结果进行分析,得到对应的第一关联特征样本数据的步骤包括:基于等位基因特异性拷贝数检测软件,对各第一目标基因测序结果进行分析,得到对应的绝对拷贝数信息;基于拷贝数变异分析与拷贝数变异模式分析软件,对各绝对拷贝数信息进行计算,得到对应的杂合性缺失比例和各拷贝数变异子模式对应的比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所),未经中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211067952.6/2.html,转载请声明来源钻瓜专利网。