[发明专利]一种遗传群体图谱构建方法、系统、存储介质及电子设备有效
| 申请号: | 202011104688.X | 申请日: | 2020-10-15 |
| 公开(公告)号: | CN112182247B | 公开(公告)日: | 2022-09-27 |
| 发明(设计)人: | 邓秀新;王楠;宋谢天;叶俊丽;谢宗周;曹榛;张斯淇 | 申请(专利权)人: | 华中农业大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/00;G06N3/04;G06N3/08;G06N3/12 |
| 代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 尉保芳 |
| 地址: | 430070 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 遗传 群体 图谱 构建 方法 系统 存储 介质 电子设备 | ||
1.一种遗传群体图谱构建方法,其特征在于,包括:
步骤1、获取矫正后的变异类型数据文件;
步骤2、对所述变异类型数据文件中的子代变异类型数据进行处理得到重组交换位点;
步骤3、根据所述重组交换位点确定n个bin区间;
步骤4、确定每个bin区间的子代基因类型;
步骤5、将每个bin区间的子代基因类型输入至joinmap4.0中得到图谱;
其中,步骤1具体为:
基于deepvariant对非PCR重复的BAM文件进行变异检测,获得包含变异类型的g.VCF文件,利用glnexus对子代的变异类型进行合并,利用卡方检验过滤p值小于0.01的子代标记,剩下位点中筛选子代个体测序覆盖达到子代群体95%的即为可用位点,利用beagle软件基于染色体上连续短片段位点连锁的特征,在1cM=0.5Mb的假设下进行未知基因型的填充,将所有位点中没有覆盖到测序片段的子代单株的基因型进行填充,获得可信度高的更加完整的VCF文件;
利用脚本获得基因组上重组交换的位点,具体的脚本算法:将基因组上所有的变异位点采用ordinalencode的离散型编码方法对基因组上所有位点进行编码,基于假设:1cM=0.5Mb,在单株200染色体级别的参考基因组在全基因组范围内以0.25MB为检测范围,随机选择其中一个子代单株在检测范围内建立索引,过滤其他单株的基因型,设置一个二维的列向量特征过滤器filter,维度为(n,1)由1和-1两个元素构成的,其中n默认设置为50,在检测范围内以50个数据为一个步骤进行遍历数据并求输入单元与过滤器filter的乘积的内积,根据内积大小大于0.95×50=40为筛选进行过滤,得到重组交换位点,经过重复两轮检测,在两轮检测中均产生信号的即为重组交换位点。
2.根据权利要求1所述的一种遗传群体图谱构建方法,其特征在于,步骤3具体为:
根据所述重组交换位点的染色体位置划分bin区间。
3.根据权利要求1所述的一种遗传群体图谱构建方法,其特征在于,步骤4具体为:
在每个bin区间内进行离散检验,对每个bin区间内的离散程度进行筛选,筛选得到的结果即为该区间的子代基因类型。
4.一种遗传群体图谱构建系统,其特征在于,包括:
获取模块,用于获取矫正后的变异类型数据文件;
处理模块、用于对所述变异类型数据文件中的子代变异类型数据进行处理得到重组交换位点;
第一确定模块,用于根据所述重组交换位点确定n个bin区间;
第二确定模块,用于确定每个bin区间的子代基因类型;
输入模块,用于将每个bin区间的子代基因类型输入至joinmap4.0中得到图谱;
其中,基于deepvariant对非PCR重复的BAM文件进行变异检测,获得包含变异类型的g.VCF文件,利用glnexus对子代的变异类型进行合并,利用卡方检验过滤p值小于0.01的子代标记,剩下位点中筛选子代个体测序覆盖达到子代群体95%的即为可用位点,利用beagle软件基于染色体上连续短片段位点连锁的特征,在1cM=0.5Mb的假设下进行未知基因型的填充,将所有位点中没有覆盖到测序片段的子代单株的基因型进行填充,获得可信度高的更加完整的VCF文件;
利用脚本获得基因组上重组交换的位点,具体的脚本算法:将基因组上所有的变异位点采用ordinalencode的离散型编码方法对基因组上所有位点进行编码,基于假设:1cM=0.5Mb,在单株200染色体级别的参考基因组在全基因组范围内以0.25MB为检测范围,随机选择其中一个子代单株在检测范围内建立索引,过滤其他单株的基因型,设置一个二维的列向量特征过滤器filter,维度为(n,1)由1和-1两个元素构成的,其中n默认设置为50,在检测范围内以50个数据为一个步骤进行遍历数据并求输入单元与过滤器filter的乘积的内积,根据内积大小大于0.95×50=40为筛选进行过滤,得到重组交换位点,经过重复两轮检测,在两轮检测中均产生信号的即为重组交换位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中农业大学,未经华中农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011104688.X/1.html,转载请声明来源钻瓜专利网。





