[发明专利]基于液相捕获技术判定单基因病相关拷贝数缺失的方法有效
申请号: | 201710859573.3 | 申请日: | 2017-09-21 |
公开(公告)号: | CN107688726B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 吉冠玉;李旭超;王君文;高飞;谢正媛;叶汉风;吉红玉 | 申请(专利权)人: | 深圳市易基因科技有限公司 |
主分类号: | G16B20/10 | 分类号: | G16B20/10;G06N3/04;G06N7/00 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 518000 广东省深圳市坪山新区坪*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 捕获 技术 定单 基因 相关 拷贝 缺失 方法 | ||
1.一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,利用bootstrap重复取样算法,通过对control区域内基因片段多次放回抽样,模拟概率密度函数,并利用贝叶斯原理计算该片段是否是缺失,方法步骤如下:
S1:设计并确定单基因病control区域;
S2:提取DNA并进行二代测序;
S3:对测序原始下机数据进行数据清洗,去除测序质量低的片段;
S4:利用unique mapped reads确定探针区域内的单个碱基位点的深度;
S5:建立样品富集的概率密度函数f(x)和数据量减半的概率密度函数f1/2(x);
S6:判别函数的确定,
S7:根据S6确定纯合函数为Hom(x),杂合则函数为Het(x),将计算结果累积求和即为样品的判定类型S(x):
S(xi)=Hom(xi)+Het(xi)
所述S5中样品富集的概率密度函数f(x),其芯片捕获的数据分布类型呈对数正态分布,计算出单次芯片捕获的均值与方差,判定均值<0.5,或者标准差>0.5者为不合格样品,需重新增加重复样品进行判定;
所述S7中将目标基因检测区域划分为100bp的小窗口bins,分别计算每个窗口的缺失类型,如果检测位置深度<0.1则相应位置判定为纯合缺失,则纯合函数Hom(x)=1,否则利用F(x)函数判定是否为杂合,杂合则函数Het(x)记为1,对于归一化后深度>1+3*标准差的样品可以判定为拷贝数增加。
2.根据权利要求1所述的一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,所述S1中的探针区域为500-1000个,每个样品的测序深度>100X。
3.根据权利要求1所述的一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,所述S2中每个样品的测序原始数据平均在300X以上。
4.根据权利要求1所述的一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,所述S3中每条测序的reads测序质量Q20以上的碱基占总碱基数目的70%以上。
5.根据权利要求1所述的一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,所述S5中数据量减半的概率密度函数的建立,是从原始数据中随机抽取一半的数据,计算control区域内经过GC校正和归一化之后的深度分布,利用bootstrap技术进行抽样,并模拟概率密度函数f1/2(x)。
6.根据权利要求1所述的一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,一个小窗口bins判定为拷贝数增加或者纯合缺失亦或者杂合缺失,则往下延伸,5个小窗口以上都有缺失的为种子判定窗口,此时如果窗口中有j个杂合,k个纯合,则判定函数为:
Hom(xi)=k
Het(xi)=j。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市易基因科技有限公司,未经深圳市易基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710859573.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种焊接治具
- 下一篇:一种激光打标机用高效除尘装置