[发明专利]利用纳米孔测序数据的高原多倍体鱼类基因组注释方法在审
| 申请号: | 202010226518.2 | 申请日: | 2020-03-27 |
| 公开(公告)号: | CN111445949A | 公开(公告)日: | 2020-07-24 |
| 发明(设计)人: | 袁晓辉;刘海平;肖世俊 | 申请(专利权)人: | 武汉古奥基因科技有限公司 |
| 主分类号: | G16B20/10 | 分类号: | G16B20/10;G16B30/10;G16B50/30 |
| 代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 梁焱 |
| 地址: | 430070 湖北省武汉市洪山*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 利用 纳米 序数 高原 多倍体 鱼类 基因组 注释 方法 | ||
本发明涉及基因组注释技术领域,提供一种利用纳米孔测序数据的高原多倍体鱼类基因组注释方法,包括:步骤1:基于纳米孔测序技术获得待注释高原多倍体鱼的全长转录组序列;步骤2:采用n种基因组预测方法分别预测待注释高原多倍体鱼可能的蛋白编码基因;步骤3:将全长转录组序列作为参考序列,将每种基因组预测方法预测得到的每个蛋白编码基因与参考序列进行比对,计算每个蛋白编码基因相对参考序列的重叠率、重叠相似度;步骤4:过滤掉重叠率和重叠相似度均低于相应阈值的蛋白编码基因,对剩下的蛋白编码基因进行整合,得到最终的预测基因集。本发明能够提高高原多倍体鱼类基因组注释的准确性和可靠性,降低基因组注释的成本。
技术领域
本发明涉及基因组注释技术领域,涉及一种高原多倍体鱼类基因组注释方法,特别是涉及一种利用纳米孔测序数据的高原多倍体鱼类基因组注释方法。
背景技术
一般基因组测序组装完成后需要对其蛋白编码基因进行结构注释。注释一般有三种方法:基于训练模型的从头预测、基于近缘物种编码基因的同源预测以及基于自身表达转录本的预测。将所有三种方法预测得到的结果进行整合得到这个物种的所有蛋白编码基因,这些基因通常能够得到多种预测方法的支持。如果每种方法都能得到较为理想的结果,最后整合得到的结果也会比较正确。但是各种方法适应的情况各异,不可能每种方法都能得到较好的预测结果,在整合的时候引入较差的预测结果可能会导致最终的预测结果较差。
对于一般的二倍体物种,使用二代测序组装得到的转录组即可直接进行评估。但是高原鱼类包含大量同源多倍体物种,由于加倍导致的同源基因ohnologs非常相似,因此采用二代转录组测序技术得到的短序列经常无法确定来自于两个ohnologs中的哪个,导致最终的组装结果可能存在大量的嵌合转录本。因此,对于多倍体的高原鱼类,如何获得准确的全长转录组序列用于评估成为一个需要解决的问题。现有对高原多倍体鱼类基因组进行注释的方法存在着基因预测的不确定性问题,预测成本较高,且预测结果不够可靠。
发明内容
针对现有技术存在的问题,本发明提供一种利用纳米孔测序数据的高原多倍体鱼类基因组注释方法,能够提高高原多倍体鱼类基因组注释的准确性和可靠性,降低基因组注释的成本。
本发明的技术方案为:
一种利用纳米孔测序数据的高原多倍体鱼类基因组注释方法,其特征在于,包括下述步骤:
步骤1:基于纳米孔测序技术获得待注释高原多倍体鱼的全长转录组序列;
步骤2:采用n种基因组预测方法分别预测待注释高原多倍体鱼可能的蛋白编码基因;
步骤3:将步骤1中获得的全长转录组序列作为参考序列,将每种基因组预测方法预测得到的每个蛋白编码基因与参考序列进行比对,计算每个蛋白编码基因相对参考序列的重叠率、重叠相似度;
步骤4:过滤掉重叠率低于重叠率阈值且重叠相似度低于重叠相似度阈值的蛋白编码基因,对剩下的蛋白编码基因进行整合,得到最终的预测基因集。
进一步的,所述步骤1具体包括:提取待注释高原多倍体鱼各个器官组织的转录组,将各个器官组织的转录组等量混合后采用纳米孔测序技术进行全长转录组测序,获得待注释高原多倍体鱼的全长转录组序列。
进一步的,所述步骤2中,n种基因组预测方法包括从头预测方法、基于同源序列的预测方法、基于转录组数据的预测方法。
本发明的有益效果为:
本发明基于纳米孔测序技术获得待注释高原多倍体鱼的全长转录组序列,降低了高原多倍体鱼类基因组注释的成本;本发明以全长转录组序列为参考序列计算每种基因组预测方法预测得到的每个蛋白编码基因相对参考序列的重叠率、重叠相似度,并利用重叠率、重叠相似度对预测结果进行过滤,对过滤后的预测结果进行整合得到最终的预测基因集,排除了各种预测噪音的干扰,提高了高原多倍体鱼类基因组注释的准确性和可靠性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉古奥基因科技有限公司,未经武汉古奥基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010226518.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于特征点的PET和MRI图像融合方法
- 下一篇:空调室内机





