[发明专利]一种优化的重叠混合测序方法在审

专利信息
申请号: 201410462490.7 申请日: 2014-09-11
公开(公告)号: CN104217135A 公开(公告)日: 2014-12-17
发明(设计)人: 孙啸;曹唱唱;李成 申请(专利权)人: 东南大学
主分类号: G06F19/22 分类号: G06F19/22
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 柏尚春
地址: 210096*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 优化 重叠 混合 方法
【权利要求书】:

1.一种优化的重叠混合测序方法,其特征在于,包括以下步骤:

步骤一、根据混合测序深度模型计算最优测序深度,对样本进行分组重叠混合测序,并根据测序代价模型选择最佳测序方案;

其中,最优测序深度是根据测序深度服从负二项分布、测序错误服从二项分布,计算得到满足假阳性错误和假阴性错误要求的最低测序深度;

分组重叠混合测序:将大规模样本分成数个小组,根据已知稀有突变的概率计算每个小组中稀有突变携带者的可能个数,然后再对每个小组进行独立的重叠混合测序;

建立合理的测序代价模型:综合考虑文库制备、测序数据两方面的成本,并根据代价模型计算重叠混合测序方案的成本,选择最优的重叠混合测序方案;

步骤二、利用上述方法开展从大量样本中筛查稀有突变携带者的高通量测序实验。

2.如权利要求1所述的优化的重叠混合测序方法,其特征在于,所述最优测序深度的计算模型如下:

假定测序深度服从如下负二项分布:

P(Nr)=NB(Nr;Dr-1,1r)]]>

其中D为平均测序深度,Nr为基因组上某个位置被测到的次数,r为负二项分布的参数且与测序平台和测序对象相关,NB表示负二项分布,

同时假定测序错误服从如下所示的二项分布:

P(E|Nr)=Bin(E;Nr,perror)

其中E为发生测序错误的次数,perror为平均测序错误率,Bin表示二项分布,

设定观察阈值为T,即观察到不少于T个携带稀有突变的测序片段则认为混合样本中包含携带稀有突变的样本,否则认为混合样本全部由正常样本组成,在此基础上,构建混合池属性判断出现假阳性错误F_P和假阴性错误F_N的概率如下:

F_P=ΣNr=TNB(Nr;Dr-1,1r)ΣE=TNrBin(E;Nr,perror)]]>

其中D为混合测序深度,Nr为基因组上某个位置被测到的次数,E为发生测序错误的次数,perror为平均测序错误率,r为负二项分布的参数;

F_N=ΣO=0T-1Σx=0OΣi=xNB(i;(1-p)Dr-1,1rBin(x;i,perror))×Σj=O-xNB(j;pDr-1,1r)Bin(j-O+x;j,perror)]]>

其中p为混合池中携带稀有突变的染色体比例,O为观测到的携带突变的测序片段个数,x为来自于正常个体的携带突变的测序片段个数,i和j分别代表来自于正常个体和携带突变个体的测序片段个数,D为混合测序深度,perror为平均测序错误率;

在给定重叠混合测序所能允许的混合池判断错误率为α的前提下,设定混合测序的最佳深度Doptimal如下:

Doptimal=min{D|F_N(D,T)≤α&F_P(D,T)≤α,T∈[1,D]}

并计算对应的观察阈值T为:

T=min{T|F_N(Doptimal)≤α&F_P(Doptimal)≤α}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410462490.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top