[发明专利]用于计算癌症样本纯度和染色体倍性的方法和装置有效
申请号: | 201710312237.7 | 申请日: | 2017-05-05 |
公开(公告)号: | CN108804876B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 黄宇;罗志辉;苏瑶;范新平 | 申请(专利权)人: | 中国科学院上海药物研究所 |
主分类号: | G16B20/10 | 分类号: | G16B20/10;G16B30/00;G16B40/00;G16B50/30 |
代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 张皓;徐琳 |
地址: | 201203 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 计算 癌症 样本 纯度 染色体 方法 装置 | ||
本发明提供了一种全自动、高效率、高准确性的计算癌症样本纯度和染色体倍性的方法和装置。通过本发明提供的层次混合高斯模型,实现了对癌症样本纯度和染色体倍性的快速和准确计算,节约了纯度估算的时间和经济成本,同时提高了计算结果的准确性。本发明在癌症样本纯度和染色体倍性计算上具有广阔的运用前景。
技术领域
本发明属于癌症研究领域,具体涉及用于计算癌症样本中癌症细胞纯度和细胞内染色体倍性的方法和装置。
背景技术
癌症的研究是生命医学中的重要研究领域,并对人类健康生活有重大影响。癌症是一类细胞恶性增殖的疾病,因其病理十分复杂,人类尚无法攻克这类疾病。二代测序(next generation sequencing)为快速检测病人遗传信息提供了可能。然而测序需要从病人组织中提取样本,但通常癌症组织并不是只单纯地包含癌症细胞,它还有非常丰富的微环境。癌症细胞微环境指包围或伴随癌症细胞的正常细胞(non-cancerous cells)环境。癌细胞样本提取时,这些微环境会和癌细胞一起被提取,并会伴随癌细胞一起被测序[1]。癌症细胞在癌症样本中的比例被定义为癌症样本的纯度。癌症基因组通常包含着大量体细胞序列拷贝数变异,这些变异主要由基因组片段扩增或删除造成。识别特定肿瘤基因组的基因组片段拷贝数变化,是癌症基因组研究的一个重要课题。要准确鉴定基因组片段拷贝数具有一定挑战,因为癌症片段拷贝数主要由两个因素混合决定,一是癌症样本纯度,即癌症细胞在癌症样本中所占比例,二是染色体倍性[2,3]。传统中鉴定癌症样本纯度和染色体倍性的方法是使用实验技术,如定量图像分析[4]或单细胞测序[5]。但是在大型项目中,这样的方法会耗费大量人力、资金和时间。随着测序技术地发展,测序数据地快速增长,以及测序数据分析技术的积累,各种各样的癌症样本纯度算法被提出,并开发出了相对应的软件。
基于基因组片段拷贝数变异和基于等位基因频率(突变位点的B-等位基因(B-allele))的计算方法被相继提出。基于等位基因频率的方法有PurityEst[6]和PurBayes[7],主要是依赖于随着肿瘤样本纯度和肿瘤基因组倍性的不同,等位基因的频率会有所不同。基于拷贝数变异的方法有CNAnorm[8]、THetA[9]、和ABSOLUTE[10]等。然而这两种方法都有不同程度的问题,使用等位基因频率的方法由于数据量的问题会有较大的误差,而运用拷贝数变异的方法虽然较稳定,但却无法区分样本纯度和染色体倍性的补偿效应,即存在识别问题。以上基于片段拷贝数的软件都没有解决这一问题,CNAnorm倾向于选择染色体倍性离二倍体最近的解决方案,ABSOLUTE结合了其他的经验数据,THetA则直接将所有可能结果都列出来了。
更优的方案应该是结合等位基因频率信息和片段拷贝数信息共同计算肿瘤样本纯度。PyLOH[11],patchwork[12]使用了基因组上杂合SNV(单核苷酸变异)位点的频率信息,和基因组片段的拷贝数。PyLOH一定程度上解决了“识别困难”的问题,可以更合理给出唯一解决方案。但是其准确性较差,特别是遇到基因组中存在亚克隆(subclone)的情况下。Patchwork同时使用了两种信息,但是在计算基因型的中间步骤中,需要人工识别,人工判断的结果缺乏准确性,并且这种半自动化软件给应用带来很多不便。
如何充分利用现有的二代测序数据准确计算癌症样本纯度和癌症细胞基因组倍性问题仍然是一项具有挑战性的工作。
参考文献
1、Junttila M R,de Sauvage F J.Influence of tumour micro-environmentheterogeneity on therapeutic response[J].Nature,2013,501(7467):346-354.
2、Carter S L,Cibulskis K,Helman E,et al.Absolute quantification ofsomatic DNA alterations in human cancer[J].Nature Biotechnology,2012,30(5):413-21.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海药物研究所,未经中国科学院上海药物研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710312237.7/2.html,转载请声明来源钻瓜专利网。