[发明专利]通过分析无细胞DNA确定肿瘤基因拷贝数的方法有效
申请号: | 201680081723.6 | 申请日: | 2016-12-16 |
公开(公告)号: | CN108603228B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 埃尔米·埃尔图凯;阿米尔阿里·塔拉萨兹;达里娅·丘多瓦;戴安娜·阿布杜伊瓦 | 申请(专利权)人: | 夸登特健康公司 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869;C12Q1/6886;C12M1/34;G16B20/10;G16B30/00;G16B30/10 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 贺淑东 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 分析 细胞 dna 确定 肿瘤 基因 拷贝 方法 | ||
1.一种计算机系统,其包括存储器和处理器,其中所述存储器用于接收受试者的体液样品的无细胞DNA分子的测序读段;且所述处理器被配置为:
(a)从所述测序读段生成第一数据集,对于多个遗传基因座中的每个遗传基因座,所述第一数据集包含:(i)与测序读段覆盖相关的定量量度(“读段覆盖”);和(ii)所述遗传基因座的鸟嘌呤-胞嘧啶含量相关的定量量度(“GC含量”);
(b)从所述第一数据集去除高变异遗传基因座,其中去除包括:
(i)拟合涉及鸟嘌呤-胞嘧啶含量相关的定量量度和所述遗传基因座的测序读段覆盖的定量量度的模型;和
(ii)从所述第一数据集去除至少10%的遗传基因座,其中去除遗传基因座包括去除与所述模型差异最大的遗传基因座的至少10%,由此提供基线定线遗传基因座的第一数据集;
(c)通过进行饱和平衡校正和探针效率校正来校正所述第一数据集,其中进行饱和平衡校正包括通过以下将基线定线遗传基因座的所述第一数据集转换为饱和校正数据集:
(i)对于每个基线定线遗传基因座,从基线定线遗传基因座的第一数据集确定来源于所述基线定线遗传基因座的来自样品的DNA分子链在测序读段内被代表的概率相关的定量量度;
(ii)通过将基线定线遗传基因座的所述第一数据集中的读段覆盖与基线定线遗传基因座的所述第一数据集的GC含量和与基线定线遗传基因座的所述第一数据集中的来源于每个基因座的DNA链在所述测序读段内被代表的概率有关的定量量度相关联,确定所述读段覆盖的第一转换;和
(iii)将所述第一转换应用于来自基线定线遗传基因座的第一数据集的每个遗传基因座的读段覆盖以提供饱和校正数据集,其中所述饱和校正数据集包括基线定线遗传基因座的第一数据集的转换的读段覆盖的第一集;
并且其中进行探针效率校正包括通过以下转换所述饱和校正数据集为探针效率校正数据集:
(i)从所述饱和校正数据集去除相对于转换的读段覆盖的所述第一集为高变异遗传基因座的遗传基因座,从而提供基线定线遗传基因座的第二数据集;
(ii)确定与基线定线遗传基因座的所述第二数据集的探针效率相关的转换的读段覆盖的第一集的第二转换,其中所述探针效率通过对一种或更多种参考样品进行饱和平衡校正来确定,其中所述探针效率是通过进行所述饱和平衡校正获得的转换的读段覆盖;和
(iii)利用所述第二转换将基线定线遗传基因座的所述第二数据集的转换的读段覆盖的所述第一集进行转换,从而提供探针效率校正数据集,其中所述探针效率校正数据集包括基线定线遗传基因座的所述第二数据集的转换的读段覆盖的第二集;
(d)确定所述第一数据集的基线读段覆盖,其中所述基线读段覆盖与饱和平衡和探针效率有关;并
(e)确定所述多个遗传基因座中每个遗传基因座相对于所述基线读段覆盖的拷贝数状态。
2.根据权利要求1所述的计算机系统,其中所述处理器被配置为去除至少45%的所述遗传基因座。
3.根据权利要求1所述的计算机系统,其中确定所述第一转换包括(i)确定与基线定线遗传基因座的所述第一数据集的读段覆盖的中心趋势有关的量度;(ii)基于所述遗传基因座的GC含量和与来源于所述遗传基因座的DNA链在所述测序读段内被代表的概率相关的定量量度,确定拟合与基线定线遗传基因座的所述第一数据集的读段覆盖的中心趋势有关的量度的函数;和(iii)对于基线定线遗传基因座的所述第一数据集的每个遗传基因座,确定由所述函数预测的读段覆盖与所述读段覆盖的差异,其中所述差异为转换的读段覆盖。
4.根据权利要求3所述的计算机系统,其中所述函数是表面近似。
5.根据权利要求4所述的计算机系统,其中所述表面近似是二维二次多项式。
6.根据权利要求1所述的计算机系统,其中从所述第一数据集去除为高变异遗传基因座的遗传基因座包括:
(i)拟合涉及所述GC含量和所述饱和校正数据集的转换的读段覆盖的第一集的模型;和
(ii)从饱和校正数据集去除至少10%的遗传基因座,其中去除遗传基因座包括去除与所述模型差异最大的遗传基因座,由此提供基线定线遗传基因座的第二数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夸登特健康公司,未经夸登特健康公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680081723.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:超分辨率测序
- 下一篇:用于高保真测序的方法和系统