[发明专利]针对靶标定序的定点噪声模型在审

专利信息
申请号: 201880064123.8 申请日: 2018-10-05
公开(公告)号: CN111164701A 公开(公告)日: 2020-05-15
发明(设计)人: A·W·布洛克尔;E·哈贝尔 申请(专利权)人: 格瑞尔公司
主分类号: G16B20/20 分类号: G16B20/20
代理公司: 北京市金杜律师事务所 11256 代理人: 董莘
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 针对 靶标 定点 噪声 模型
【说明书】:

一种处理系统,其使用基于贝叶斯推论(Bayesian inference)的针对靶标定序或变体辨认的模型。在一个实施例中,该处理系统确定第一序列片段的第一深度和第一交替深度,该第一序列片段来自受试者的无细胞核酸样本。该处理系统确定第二序列片段的第二深度和第二交替深度,该第二序列片段来自该受试者的基因核酸样本。该处理系统确定该无细胞核酸样本和该基因核酸样本的真交替频率的可能性。使用该第一可能性、该第二可能性和一或多个参数,该处理系统确定以下的可能性:该无细胞核酸样本的该真交替频率大于该基因核酸样本的该真交替频率的函数。

技术领域

本公开总体上涉及基于贝叶斯推论(Bayesian inference)的针对靶标定序的模型,且涉及该模型在变体辨认及品质控制中的使用。

背景技术

计算技术可用于DNA定序数据以标识DNA中可能与各种类型的癌症或其他疾病对应的变异或变体。因此,癌症诊断或预测可能通过分析诸如组织活检或取自受试者的血液的生物样本而进行。难以检测源于血液样本的肿瘤细胞的DNA,这是因为相对于取自血液的无细胞DNA(cfDNA)中的其他分子,循环肿瘤DNA(ctDNA)通常以低含量存在。现有方法无法从信号噪声标识真阳性(例如,指示受试者中的癌症),削弱已知系统及未来系统区分真阳性与噪声源产生的假阳性的能力,其可导致变体辨认或其他类型的分析的不可靠结果。

发明内容

本文公开了用于训练及应用定点噪声模型(本文也称为“贝叶斯层次模型”、“噪声模型”或“模型”)以确定靶标定序中真阳性的可能性的方法。真阳性可能包括碱对的单核苷酸变体、插入或缺失。特别地,模型可能使用贝叶斯推论以确定噪声比或噪声级,例如,指示核酸序列的每个位置的某些变异的预计可能性。此外,模型可能是造成共变量(例如,三核苷酸背景、作图性或区段式复制)及各种类型的参数(例如,序列片段的混合组分或深度)的层次模型。模型可能通过采样自健康受试者的序列片段的马可夫链蒙特卡罗(Markovchain Monte Carlo)加以训练。因此,并入模型的总管线可以较高敏感度标识真阳性且滤除假阳性。

在各种实施例中,用于处理核酸样本的定序数据的方法包括标识多个序列片段的候选变体。方法进一步包括访问多个参数,该多个参数包括特定于候选变体的分散度参数r及平均率参数m,其中r及m是使用模型导出。方法进一步包括将多个序列片段的片段信息输入至由多个参数进行参数化的函数中。方法进一步包括使用基于输入片段信息的函数的输出来确定候选变体的分数。

在一或多个实施例中,多个参数代表伽马分布的平均及形状参数,并且函数是基于多个序列片段及多个参数的负二项式。

在一或多个实施例中,多个参数代表分布的参数,该分布关于序列片段的给定位置而编码不确定水平的核苷酸变异。

在一或多个实施例中,伽马分布是分布的混合物的一个组分。

在一或多个实施例中,从来自多个健康个体的序列片段的训练样本中导出多个参数。

在一或多个实施例中,训练样本不包括来自多个健康个体的序列片段的、基于筛选标准的子集。

在一或多个实施例中,筛选标准指示不包括具有以下项的序列片段:(i)小于阈值的深度或(ii)大于临界频率的等位基因频率。

在一或多个实施例中,筛选标准基于候选变体在基因组中的位置而改变。

在一或多个实施例中,使用贝叶斯层次模型导出多个参数。

在一或多个实施例中,贝叶斯层次模型包括多项分布,该多项分布将序列片段的位置分组至潜在类别中。

在一或多个实施例中,贝叶斯层次模型包括与来自健康个体的训练样本无关的固定共变量。

在一或多个实施例中,共变量是基于邻近序列片段的给定位置的多个核苷酸。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于格瑞尔公司,未经格瑞尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201880064123.8/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top