[发明专利]一种判断胎儿基因型的方法有效
申请号: | 201410439489.2 | 申请日: | 2014-09-01 |
公开(公告)号: | CN104182655B | 公开(公告)日: | 2017-03-08 |
发明(设计)人: | 陈昌岳;王璇;任一;张祥林 | 申请(专利权)人: | 上海美吉生物医药科技有限公司 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 南京同泽专利事务所(特殊普通合伙)32245 | 代理人: | 蒋全强 |
地址: | 201321 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 判断 胎儿 基因型 方法 | ||
技术领域
本发明涉及一种基于特定的算法推断基因型的方法,属于生物技术领域。
背景技术
基因型又称遗传型,是某一生物个体全部基因组合的总称。它反映生物体的遗传构成,即从双亲获得的全部基因的总和。据估计,人类的结构基因约有5万对。因此,整个生物的基因型是无法表示的,遗传学中具体使用的基因型,往往是指某一性状的基因型。在人类染色体中,决定遗传性状的是来自父母的一对染色体上对应的基因,因为人体有各来自父母的俩套染色体,所以又称为二倍体。
基因型的判断结果可以作为中间结果,为学术研究、遗传性疾病的预防、个体化用药,遗传性疾病的诊断提供数据信息。目前,常见的基因型检测技术有荧光定量PCR技术、高通量测序技术、基因芯片技术等,这些技术各有优缺点,中国专利文献CN100482806C公开了一种基因型分型方法,改良的多重聚合酶链式反应包括一个同步聚合酶链式反应以及一个特异性聚合酶链式反应,而且这两个扩增步骤皆可以递减策略来进行,其中宽松的递减策略是以低于最佳退火温度的温度来使用,而严谨的递减策略是以高于最佳退火温度的温度来使用,这是典型的PCR技术。
通过上述技术检测基因型都需要先取得生物的DNA样本,然后进行检测。但是在判断胎儿基因型时就存在诸多的问题。检测胎儿的基因型时,如果通过侵入性实验(如羊水穿刺)来获得胎盘物质,从而进行基因分型,会增加孕妇的流产风险;如果对父母的基因型进行单倍体测序,实验繁琐,周期很长,花费很多。
发明内容
本发明的目的是提供一种仅凭孕妇的外周血,精确且安全的判断胎儿基因型的方法。
实现本发明目的的一个技术方案是一种判断胎儿基因型的方法,不用于疾病的诊断和治疗,包括以下具体步骤:
A. 提取孕妇外周血DNA样本,进行外显子测序,得到原始数据;
B. 对原始数据进行质控,与参考序列比对,检测SNP,注释并统计;
C. 基于孕妇和胎儿的基因型的四种组合方式,用最大期望值算法计算得到四种组合方式的SNP位点的最小等位基因频率的混合高斯模型;
所述四种组合方式分别是孕妇和胎儿都是纯合子时的第一组合方式,胎儿是杂合子且孕妇是纯合子的第二组合方式,胎儿是纯合子且孕妇是杂合子的第三组合方式和孕妇,以及胎儿都是杂合子的第四组合方式;
D.计算得到混合高斯模型的三个临界值;
所述三个临界值从小到大分别是第一临界值、第二临界值和第三临界值;所述第一临界值是所述第一组合方式的混合高斯模型与第二组合方式的混合高斯模型的交点,所述第二临界值是所述第二组合方式的混合高斯模型与第三组合方式的混合高斯模型的交点,所述第三临界值是所述第三组合方式的混合高斯模型与第四组合方式的混合高斯模型的交点;
E.通过比较各SNP位点的最小等位基因频率与三个临界值之间的大小关系判断胎儿基因型;
当SNP位点的最小等位基因频率小于或等于第一临界值时,孕妇和胎儿都是纯合子;当SNP位点的最小等位基因频率小于或等于第二临界值且大于第一临界值时,胎儿是杂合子且孕妇是纯合子;当SNP位点的最小等位基因频率小于或等于第三临界值且大于第二临界值时,胎儿是纯合子且孕妇是杂合子;当SNP位点的最小等位基因频率大于第三临界值时,孕妇和胎儿都是杂合子。
上述混合高斯模型的定义为
,
,
其中,K是高斯分布模型的个数,K=4,πk是第k个高斯分布的概率密度函数,μk是第k个高斯分布的均值,δk是第k个高斯分布的方差。
上述述最大期望值算法计算得到混合高斯模型的具体步骤是:
步骤一,假设πk、μk和δk的初始值已知,估计每个高斯模型的权重γ(i,k),计算公式为
,
其中,i是所有最小等位基因频率数据的数位;j是高斯分布模型的数位;
步骤二,基于估计的每个高斯模型的权重,确定πk、μk和δk,计算公式为
,
,
,
,
其中,n是所有最小等位基因频率数据的个数;
步骤三,将第二步确定的πk、μk和δk代入目标函数
中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海美吉生物医药科技有限公司,未经上海美吉生物医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410439489.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用