[发明专利]一种基于混合线性模型的多性状关联分析方法有效
申请号: | 201610045592.8 | 申请日: | 2016-01-22 |
公开(公告)号: | CN105740649B | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 徐海明;刘守业;祁婷;朱智宏;朱军 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混合线性模型 性状关联分析 性状 变异信息 关联分析 全基因组 位置估算 效应估计 性状分析 遗传模型 遗传效应 多变量 假阳性 构建 估算 遗传 统计 分析 | ||
本发明公开了一种基于混合线性模型的多性状关联分析方法,该方法包括:构建统计遗传模型;确定效应显著的单位点SNP标记;确定互作效应显著的二互作上位性SNP标记;估算遗传效应。本发明基于多变量混合线性模型的多性状全基因组关联分析方法综合利用了多个遗传相关性状的变异信息,与单性状分析方法相比,具有较高的分析功效和较低的假阳性,QTS位置估算更为准确,效应估计更为稳健。
技术领域
本发明涉及多性状联合定位技术领域,尤其涉及一种基于混合线性模型的多性状关联分析方法。
背景技术
全基因组关联分析已经变成一种标准的探索复杂性状遗传结构和解释数量性状遗传变异基础的有效方法。关联分析方法中的主要问题在于解释数据的依赖性,包括个体之间的依赖和位点之间的依赖性。混合线性模型同时包含固定效应和随机效应,可以有效的解释大数据中存在的群体结构,包括群体分层和亲缘关系。
然而,大多数的关联分析方法都只针对单个数量性状,不能综合考虑多个遗传相关的性状进行联合分析,无法剖析多个性状遗传相关的分子机理,无法分析遗传位点的多效性等,例如:
申请公布号CN103632067A的发明专利申请文献公开了一种基于混合线性模型的种子数量性状位点定位方法,该方法包括:(1)统计遗传模型的建立;(2)全基因组扫描显著的标记区间:基于模型在全基因组范围内,通过表型和每个标记区间做基于HendersonIII的F检验,搜索得到所有可能存在QTL的候选标记区间;(3)在全基因组范围内搜索显著的数量性状位点,将步骤(2)中得到的候选标记区间作为协变量,然后以1cm为步长,在全基因组范围内做基于HendersonIII的F检验,搜索显著的QTL位点;(4)在全基因组范围内搜索显著的二互作标记区间:将步骤(2)中得到的候选标记区间作为协变量,然后在全基因组范围内做基于HendersonIII的F检验,搜索得到显著的二互作标记区间;(5)搜索显著的二互作上位性的位点:以步骤(3)得到的QTL以及步骤(4)得到的显著的互作标记区间作为协变量,然后在所述显著的互作标记区间中做基于HendersonIII的F检验,搜索得到显著的二互作上位性的位点;(6)遗传参数的估算:通过步骤(3)得到的显著的QTL位点和步骤(5)得到的显著的二互作上位性位点,获取得到模型中各种效应系数,然后通过模型,计算得到这些位点的效应以及估算每个位点的遗传率。
目前,已有一些基于多变量混合线性模型的多性状关联分析方法,如MTMM(Kroteet al.,2012,Nature Genetics,44(9):1066-1071),GEMMA(Zhou et al.,2014.NatureMethods,11(4),407-409)等。但是,这些方法或者计算量大,或者无法分析三个或三个以上的形状,或者无法分析基因间互作、基因与环境间互作效应。
因此,有必要再探究一种更为高效的能够进行多性状关联分析的定位方法,已解决上述问题。
发明内容
本发明提供了一种基于混合线性模型的多性状联合定位方法,该方法分析功效较高、假阳性较低,QTS位置估算更准确,效应估计更稳健。
一种基于混合线性模型的多性状关联分析方法,包括:
(1)构建统计遗传模型:
假设一个自然群体由n个个体组成,在p个不同环境中进行田间试验,m个相关性状的遗传变异受s个QTS位点和t对二互作上位性的调控;环境k中针对第i个性状的第j个株系的表型观测值yijk表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610045592.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种指纹识别装置及终端设备
- 下一篇:利用电话号码提供宽带业务的系统和方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用