[发明专利]一种基于SNPLDB标记的限制性二阶段全基因组关联分析方法有效
| 申请号: | 201510092169.9 | 申请日: | 2015-03-02 |
| 公开(公告)号: | CN104651517B | 公开(公告)日: | 2017-05-31 |
| 发明(设计)人: | 盖钧镒;贺建波;孟珊;管荣展;赵团结 | 申请(专利权)人: | 南京农业大学 |
| 主分类号: | C12Q1/68 | 分类号: | C12Q1/68;G06F19/18 |
| 代理公司: | 南京知识律师事务所32207 | 代理人: | 高玲玲 |
| 地址: | 210095 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 snpldb 标记 限制性 阶段 基因组 关联 分析 方法 | ||
技术领域
本发明属于分子数量遗传和分子育种技术领域,具体涉及一种基于SNPLDB标记的限制性二阶段全基因组关联分析方法。
背景技术
绿色革命通过群体株型改造育成高产品种是常规育种技术发展的成功。常规育种主要是创造超亲重组型,但以往育种家只能通过表型评估来设计组合并间接追踪超亲重组型。分子技术的快速发展为直接鉴别超亲重组基因型提供了可能。
基于种质资源群体的全基因组关联分析(GWAS)为全面解析农艺性状的遗传基础提供了方法。以往植物中的GWAS研究主要目的是发掘主效基因,但是通过提高显著水平来尽可能降低假阳性的同时却导致了检测功效大大降低。植物育种家为了准确检测全基因组数量性状基因座(QTL),他们的GWAS策略必须符合种质资源中广泛存在复等位基因的情况,并需要在缺失遗传率和遗传率过高估计之间进行平衡,以及矫正由近交和迁移导致的群体偏差。
现有GWAS广泛使用的单核苷酸多态性(SNP)分子标记仅有两个等位变异,无法估计资源群体中大量存在的复等位基因效应,这进一步限制了其在常规育种中的应用。另外,GWAS的精度依赖于连锁不平衡(LD)的衰减距离。随机交配群体的LD衰减距离通常较短,GWAS的精度也较高。但自花授粉作物自然群体往往严重偏离随机交配群体,高度自交导致了群体较长的LD衰减距离,GWAS的精度也随之降低。
GWAS一直饱受高假阳性的困扰,现有GWAS方法研究也主要针对如何通过控制群体结构来降低假阳性。群体结构推断和主成分分析是GWAS中两种广泛使用的降低假阳性的方法,这两种方法均通过将推断的群体结构特征作为协变量引入GWAS统计模型以降低群体结构的影响。但已有报道显示群体内个体间的亲缘关系也会导致GWAS中的假阳性,GWAS应同时考虑群体结构和亲缘关系。相应地,研究者提出了一系列基于混合线性模型(LMM)的GWAS方法将个体间两两亲属关系考虑进来。LMM方法假定每个个体均抽样自不同的群体,并将群体背景作为随机效应,群体结构作为固定效应拟合到GWAS统计模型,并将群体的亲本系数(kinship)矩阵作为随机效应的协方差结构。目前,LMM方法被认为比基于群体结构和PCA的GWAS假阳性更低,已被广泛应用于动植物遗传研究。但是,大量基于LMM的GWAS研究结果仅能检测到少数几个位点,并且仅解释表型变异的很少部分,而实际上数量性状通常由许多效应大小不等的位点控制。因此,较高的假阴性率导致了GWAS的失踪遗传率问题,即关联位点的总遗传贡献率远低于性状遗传率。LMM方法主要依赖的kinship矩阵通常是由全基因组分子标记估计得到的,该矩阵实际上是个体间状态同样的估计。实际研究通常使用所有的分子标记来估计这种kinship矩阵,但是最新研究表明kinship估计中所用分子标记如果包含遗传位点SNP标记时,GWAS的功效将会降低,反之,假阳性会升高。研究者也相应的提出了几种方法来解决基于LMM方法的GWAS中kinship敏感的问题,但是对于解决失踪遗传率问题帮助甚微。
发明内容
本发明目的在于提供一种基于SNPLDB标记的限制性二阶段全基因组关联分析方法,该方法结合基于单倍型区块构建的SNPLDB标记、近交群体关联分析模型偏差矫正和多位点模型下二阶段关联分析策略,建立了适合于近交作物常规育种应用的GWAS方法。
本发明解决其技术问题所采取的技术方案是:一种基于SNPLDB标记的限制性二阶段全基因组关联分析方法,包括如下步骤:
a)构建全基因组SNPLDB标记:首先对已有种质资源群体的全基因组SNP基因型数据进行连锁不平衡分析,然后利用Haploview软件定义全基因组SNP分子标记的单倍型区块,阈值为D'>0.7,窗口设为估计的LD衰减距离;最后将单倍型区块内的SNP分子标记合并为新的标记,即SNPLDB标记,也就是将单倍型区块内的每一个单倍型视为位点的一个等位变异并进行编码;对于频率较低的单倍型(频率小于1%),通过单倍型的聚类分析使用最为相似的单倍型替换低频率的单倍型。
近交群体较长的LD衰减距离说明基因型呈现出区块结构,即基因组可以分割为长度不等的区块,区块间重组频繁,区块内重组较少,一般的解释是染色体上存在着大量的重组热点。本发明发现由于重组热点区域频繁的重组导致了重组不频繁的区域呈现出区块的模式。这种区块内丰富的单倍型变异提供了类似复等位基因的变异特征,相比SNP分子标记更符合具有广泛遗传变异的种质资源群体的遗传特征,可利用此特性来估计自然群体中的复等位基因信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京农业大学,未经南京农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510092169.9/2.html,转载请声明来源钻瓜专利网。





