[发明专利]遗传分离群体的遗传图谱构建方法及装置有效
申请号: | 201810689069.8 | 申请日: | 2018-06-28 |
公开(公告)号: | CN108846260B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 郑洪坤;许语辉;谭云涛;刘敏 | 申请(专利权)人: | 北京百迈客生物科技有限公司 |
主分类号: | G16B20/40 | 分类号: | G16B20/40;G16B30/20;G16B40/00;G16B15/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 101300 北京市顺义区南*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 遗传 分离 群体 图谱 构建 方法 装置 | ||
1.一种遗传分离群体的遗传图谱构建方法,其特征在于,包括:
S1、通过对遗传分离群体的全基因组进行标记开发和分型,得到所述遗传分离群体的分子标记和所述分子标记所属的分型类型,并对所述分子标记进行连锁群划分;
S2、对于每一个连锁群,根据分子标记之间的重组率和所述分型类型对该连锁群内的分子标记重新分型,对重新分型得到的结果中的分型错误和缺失进行纠错,基于纠错的结果对该连锁群内的分子标记进行排序,基于排序结果构建所述遗传分离群体的遗传图谱;
其中,所述对所述分子标记进行连锁群划分,包括:
对于每两个分子标记,根据该两个分子标记可能所属的分型类型构架二维棋盘表;
对于每一个二维棋盘表,统计该二维棋盘表的行频数、列频数和总频数,以及该二维棋盘表中每种分型的频数,并基于该二维棋盘表的行频数、列频数和总频数计算所述每种分型出现的理论频数,根据所述每种分型的频数和每种分型出现的理论频数计算独立性检验统计量,根据所述独立性检验统计量计算该二维棋盘表对应的两个分子标记之间的连锁分析mLOD;
以每两个分子标记之间的连锁分析mLOD为距离指标,采用分层聚类中的单链接聚类算法对所述分子标记进行连锁群划分;
其中,所述根据分子标记之间的重组率和所述分型类型对该连锁群内的分子标记重新分型,包括:
根据分子标记之间的重组率确定目的连锁相组合;
利用所述目的连锁相组合对所述全基因组上缺失的连锁相组合进行填补,对所述全基因组上错误的连锁相组合进行矫正;
依据填补、矫正后所述全基因组上的连锁相组合确定重组断点,根据所述重组断点和所述分型类型对该连锁群内的分子标记重新分型。
2.根据权利要求1所述的方法,其特征在于,所述对重新分型得到的结果中的分型错误和缺失进行纠错,包括:
采用KNN算法对重新分型得到的结果中的分型错误和缺失进行纠错。
3.根据权利要求2所述的方法,其特征在于,所述基于纠错的结果对该连锁群内的分子标记进行排序,包括:
对该连锁群内的分子标记进行预设数量次空间抽样,得到多个分子标记集合,其中,所述分子标记集合的数量为所述预设数量,每个分子标记集合包含连锁群内的至少一个分子标记,前一次空间抽样得到的分子标记集合是后一次空间抽样得到的分子标记集合的子集,最后一次空间抽样得到的分子标记集合为该连锁群内的分子标记组成的集合;
按照空间抽样顺序,基于纠错的结果采用模拟退火算法和吉布斯抽样方法对每次空间抽样得到的分子标记集合中的分子标记进行排序,其中,后一次空间抽样得到的分子标记集合中的分子标记在前一次空间抽样得到的分子标记集合中的分子标记的排序基础上进行排序。
4.根据权利要求3所述的方法,其特征在于,所述对该连锁群内的分子标记进行预设数量次空间抽样,包括:
对于每一个给定的重组率阈值,在该重组率阈值上对该连锁群内的分子标记进行空间抽样,得到一个分子标记集合,其中,该分子标记集合中任意两个分子标记之间的重组率大于或等于该重组率阈值,给定的重组率阈值的数量为所述预设数量。
5.根据权利要求1所述的方法,其特征在于,所述遗传分离群体为CP性状分离群体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百迈客生物科技有限公司,未经北京百迈客生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810689069.8/1.html,转载请声明来源钻瓜专利网。