[发明专利]新配杂交组合表型的预测方法在审
申请号: | 201710100968.5 | 申请日: | 2017-02-23 |
公开(公告)号: | CN108470112A | 公开(公告)日: | 2018-08-31 |
发明(设计)人: | 刘哲;封伟;刘玮;史梦莹;曲艺伟;李绍明;张晓东;朱德海 | 申请(专利权)人: | 中国农业大学 |
主分类号: | G06F19/20 | 分类号: | G06F19/20;A01H1/02 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王庆龙 |
地址: | 100193 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 杂交种 表型 指纹信息 自交系 表型预测 训练样本 杂交组合 差异度 基因型 配合力 组配 成功率 预测 历史测试 历史数据 目标区域 算法合成 指纹合成 预设 育种 环节 表现 | ||
1.一种新配杂交组合表型的预测方法,其特征在于,包括:
对所有自交系进行类群划分;
计算类群划分后各群间的特殊配合力,并根据所述特殊配合力或杂交种历史测试表现确定目标区域的杂优模式,确定参与组配的自交系;
根据所述参与组配的自交系的指纹信息,通过预设指纹合成算法,合成新配杂交种的指纹信息;
通过计算所述新配杂交种与训练样本中各已配杂交种的指纹信息差异度,在训练样本中寻找所述新配杂交种的相似杂交种;
根据所述新配杂交种与其在训练样本中的各相似杂交种的指纹信息差异度,对所述新配杂交种的表型进行预测,获得新配杂交种的表型预测结果。
2.根据权利要求1所述的方法,其特征在于,在所述获得新配杂交种的表型预测结果之后,所述方法还包括:
评价所述表型预测结果的可信度;
根据所述表型预测结果、所述表型预测结果的可信度和训练样本表型认知度,对所述新配杂交种的杂交组合进行评价筛选,确定最终组配方案。
3.根据权利要求2所述的方法,其特征在于,所述评价所述表型预测结果的可信度,包括:
以训练样本中相似杂交种的权重均值,作为所述表型预测结果的可信度;
或者,
将所述表型预测结果作为已知值,将训练样本分为两部分,一部分作为验证样本,将所述验证样本作为新的训练样本,按照权利要求1所述方法,将获得的新配杂交种的第二表型预测结果,计算所述第二表型预测结果与所述已知值的相关系数,将所述相关系数作为所述表型预测结果的可信度。
4.根据权利要求1所述的方法,其特征在于,所述对所有自交系进行类群划分,包括:
计算不同自交系的DNA指纹的差异度;
根据所述不同自交系的DNA指纹的差异度,使用基于群代表最小差异度的聚类式类群划分算法,对所有自交系进行类群划分。
5.根据权利要求4所述的方法,其特征在于,所述根据所述不同自交系的DNA指纹的差异度,使用基于群代表最小差异度的聚类式类群划分算法,对所有自交系进行类群划分,包括:
根据自交系的有效位点数和杂合度,基于预设最少有效位点数和预设最大杂合度,确定候选群代表;
根据自交系的DNA指纹的差异度,基于预设分群阈值,确定候选群代表是单独成群,还是非单独成群;
对于每一非候选群代表,将该非候选群代表与候选群代表中差异度最小的两个自交系归为一个群;
将候选群代表中差异度最小的两个非单独成群的自交系归为一个群。
6.根据权利要求1所述的方法,其特征在于,所述计算类群划分后各群间的特殊配合力,包括:
获取所有杂交组合的表型平均值;
根据所述所有杂交组合的表型平均值,通过第一公式,计算得到类群划分后各群的一般配合力;
根据所述所有杂交组合的表型平均值和类群划分后各群的一般配合力,通过第二公式,计算得到类群划分后各群间的特殊配合力;
其中,所述第一公式为:
GGCAa为群a的一般配合力,是所有杂交种的表型平均值,Xj·为所有包含群a亲本的杂交组合的表型平均值,j=1,2,...,m,m为群a中亲本的个数,n为与群a杂交的群数,mn为所有包含有群a亲本的杂交组合的数目;
所述第二公式为:
GSCAab为群a和群b间的特殊配合力,GGCAa为群a的一般配合力,GGCAb为群b的一般配合力,Xab为包含有群a亲本和群b亲本所配的所有杂交组合的表型平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710100968.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用