[发明专利]一种遗传群体图谱构建方法、系统、存储介质及电子设备有效
| 申请号: | 202011104688.X | 申请日: | 2020-10-15 |
| 公开(公告)号: | CN112182247B | 公开(公告)日: | 2022-09-27 |
| 发明(设计)人: | 邓秀新;王楠;宋谢天;叶俊丽;谢宗周;曹榛;张斯淇 | 申请(专利权)人: | 华中农业大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/00;G06N3/04;G06N3/08;G06N3/12 |
| 代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 尉保芳 |
| 地址: | 430070 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 遗传 群体 图谱 构建 方法 系统 存储 介质 电子设备 | ||
本发明公开了一种遗传群体图谱构建方法、系统、存储介质及电子设备,涉及遗传学领域。该方法包括:一种遗传群体图谱构建方法,包括:步骤1、获取矫正后的变异类型数据文件;步骤2、对所述变异类型数据文件中的子代变异类型数据进行处理得到重组交换位点;步骤3、根据所述重组交换位点确定n个bin区间;步骤4、确定每个bin区间的子代基因类型;步骤5、将每个bin区间的子代基因类型输入至joinmap4.0中得到图谱。本发明能够解决处理时间过长问题,避免偏分离问题,实现精准构建谱图。
技术领域
本发明涉及遗传图谱构建领域,尤其涉及一种遗传群体图谱构建方法、系统、存储介质及电子设备。
背景技术
传统方法利用GATK进行变异检测,从测序下机到变异检测完成需要2-3天,同时因为缺少金标准的变异VCf文件,也没办法进行BQSR检测,不能重新矫正,且在处理~2Tb左右的数据进行并行处理更需要一个月以上,时间过长,另外传统构建方法中普遍存在假阳性的变异位点,以及偏分离的特征,这在一定程度上是图距表现出不均匀,标记密度稀疏,并且容易引入错误,造成定位结果不准确。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种遗传群体图谱构建方法、系统、存储介质及电子设备。
本发明解决上述技术问题的技术方案如下:一种遗传群体图谱构建方法,包括:
步骤1、获取矫正后的变异类型数据文件;
步骤2、对所述变异类型数据文件中的子代变异类型数据进行处理得到重组交换位点;
步骤3、根据所述重组交换位点确定n个bin区间;
步骤4、确定每个bin区间的子代基因类型;
步骤5、将每个bin区间的子代基因类型输入至joinmap4.0中得到图谱。
本发明的有益效果是:通过上述方法可以有效的节约时间成本,提高效率,通过对于变异类型数据文件的校正可以提高数据的可信度同时减少了信息丢失的可能性,另外通过编码和特征过滤来计算重组交换位点等手段有效的避免了偏分离的特征,这在一定程度上杜绝了图距表现出不均匀,标记密度稀疏,并且引入错误等问题,另外,本方法能保留大量足够的nn X np和lm X ll标记,在使用BC1模型进行图谱构建的过程中具有精细准确的效果。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,步骤1具体为:
通过对非聚合酶链式反应重复的BAM文件进行变异检测,得到含有变异类型的文件数据,将所述文件数据中的子代变异类型中不符合遗传规律的变异位点剔除,将剔除后的文件数据进行合并,得到矫正后的变异类型数据文件。
采用上述进一步方案的有益效果是,通过对BAM文件进行变异检测可以粗略过滤文件中不符合要求的比对数据,这样不仅减少了后续对文件处理的工作量,同时提高了整套流程的处理效率,且更为重要的是将不符合要求的变异点剔除后可以极大程度提高比对到基因组的质量。
进一步,步骤1之后还包括:
步骤101、利用卡方检验对所述矫正后的变异类型数据文件进行检验,得到第一矫正数据。
采用上述进一步方案的有益效果是,卡方检验在检验单变量多项分类上的实计数和理论次数分布之间的差异效果显著,因此,通过卡方检验的数据可信度较高,可以为后续数据处理做好铺垫,在保证数据有效性的同时降低了后期数据处理的数量,提高了处理效率以及精确度,并且在一定程度上排除了由于错误比对的部分结果影响,筛选出了符合遗传学的变异位点,提高了后期用于构建图谱的基因型准确度。
进一步,步骤1之后还包括:
步骤102、对所述第一矫正数据进行未知基因类型填充,得到第二矫正数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中农业大学,未经华中农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011104688.X/2.html,转载请声明来源钻瓜专利网。





