[发明专利]用于亲权鉴定的SSR位点的筛选方法和应用在审
| 申请号: | 201811125248.5 | 申请日: | 2018-09-26 |
| 公开(公告)号: | CN109207606A | 公开(公告)日: | 2019-01-15 |
| 发明(设计)人: | 兰道亮;陈通;吉文汇;李键;朱育星;蔡雯祎;熊显荣;张大伟 | 申请(专利权)人: | 西南民族大学 |
| 主分类号: | C12Q1/6888 | 分类号: | C12Q1/6888;C12N15/11 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 齐云 |
| 地址: | 610000 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 位点 筛选 亲权鉴定 全基因组序列 生物技术领域 物种 衰减距离 遗传特征 子代 构建 可用 过滤 排序 应用 验证 杂交 | ||
1.一种用于亲权鉴定的SSR位点的筛选方法,其特征在于,包括:
(S1)筛选出待筛选SSR位点的物种的全基因组序列所有潜在的SSR位点,再筛选出位于基因区间内的SSR位点,再过滤掉单核苷酸重复类型的SSR位点;然后筛选出具有多态性的SSR位点;
(S2)然后过滤掉满足如下条件的SSR位点,得到候选SSR位点:(a1)缺失值比例>50%;(a2)哈温平衡检验显著性<0.01;
(S3)计算候选SSR位点的LD衰减距离;
(S4)将候选SSR位点按照PE值排序,然后筛选出符合如下条件的SSR位点:(b1)MAF值≤M;(b2)缺失值比例<10%;(b3)任意两个SSR位点的距离>LD衰减距离;(b4)重复单元≥N;
其中,所述M和所述N按照如下方法得到:
模拟产生具有SSR位点的亲代个体,所述亲代个体满足如下条件:(c1)亲代个体的SSR位点距离≥LD衰减距离;(c2)亲代个体的基因型满足哈温平衡;
然后将亲代个体作为父本,按照如下条件产生子代个体:(d1)杂交过程完全随机杂交;(d2)重组过程无连锁现象;(d3)个体不产生随机突变;
然后模拟计算如下指标:
(e1)不同MAF的条件下亲子关系准确率,得到亲子关系准确率至少为99.9%时的MAF值,记为M;
(e2)不同SSR分型类型、不同位点规模下CPE的变化,以确定SSR位点的重复单元数,记为N;
其中,所述待筛选SSR位点的物种为牦牛;将牦牛的候选SSR位点按照PE值排序,然后筛选出符合如下条件的SSR位点:(b1)MAF值≤0.3;(b2)缺失值比例<10%;(b3)任意两个SSR位点的距离>2kb;(b4)重复单元≥3。
2.根据权利要求1所述的SSR位点的筛选方法,其特征在于,以待筛选SSR位点的物种的高通量测序数据作为全基因组序列的数据来源。
3.根据权利要求2所述的SSR位点的筛选方法,其特征在于,从NCBI SRA 数据库中筛选所述物种的相同测序平台下,并且数据质量整齐度一致的测序样本,然后进行数据校准和整理以及重复序列标记和合并。
4.根据权利要求3所述的SSR位点的筛选方法,其特征在于,所述数据校准和整理包括:收集到的SRA数据首先用sra-tool kit的“fastq-dump-split-3”命令将其转换为FASTQ数据格式,用cutadapt程序去除序列分数<20的低质量测序片段/残基,得到过滤后测序数据,再用Burrows-Wheeler Alignment(BWA)tool对比工具的“bwa mem-T 30-h 5”程序将过滤后测序数据比对到牦牛基因组上,同时检查比对质量,把质量分值低于30的过滤掉以减少假阳性,然后用Samtools软件将比对结果进行格式转换及排序,产生对比后BAM数据文件格式。
5.根据权利要求3所述的SSR位点的筛选方法,其特征在于,所述重复序列标记和合并包括:用Picard Mark Duplicates软件来鉴定和标记每个比对后产生的BAM数据文件,将过度重复测到的冗余BAM数据文件进行合并,以保证每个样本产生一个对应的单独BAM数据文件。
6.根据权利要求1所述的SSR位点的筛选方法,其特征在于,使用scikit-learnpackage模拟产生具有SSR位点的亲代个体。
7.根据权利要求1所述的SSR位点的筛选方法,其特征在于,使用VCFtools对候选SSR位点数据进行LD分析,计算位点间的LD水平,并绘制LD衰减图。
8.根据权利要求1所述的SSR位点的筛选方法,其特征在于,所述筛选方法还包括分析潜在的SSR位点的特征,以用于作为模拟筛选的SSR位点库;
所述特征包括采用PSR Modify version统计具有多态性的SSR位点,及未检测到多态性的位点;统计SSR重复类型及其重复性占比;统计群体中每个个体纯合位点及杂合位点的数量和统计位点分型及MAF值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南民族大学,未经西南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811125248.5/1.html,转载请声明来源钻瓜专利网。





