[发明专利]一种转录本的分类方法有效
申请号: | 201910388054.2 | 申请日: | 2019-05-10 |
公开(公告)号: | CN111916147B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 封力;汤冬;王毓博;李净净;梁帆;胡江;汪德鹏 | 申请(专利权)人: | 武汉希望组生物科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B30/10 |
代理公司: | 武汉河山金堂专利事务所(普通合伙) 42212 | 代理人: | 胡清堂 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 转录 分类 方法 | ||
本发明属于生物技术信息领域,具体涉及一种转录本分类方法,该方法是通过准确定位剪切位点对转录本进行分类,具体包括以下步骤:对测序所得全长转录本结果质控,获得高质量全长转录本;将高质量全长转录本与参考基因组比对,获得相同基因模型下的所有转录本信息,去冗余,一个基因模型下的一种剪切模式只保留唯一最长的转录本;根据剪切位点,对全长转录本进行分类,获得初步分类结果;过滤初步分类结果,获得最终分类结果。该方法分类准确,假阳性率很低,适用性广泛,有效解决了现有技术不准确、分类不理想的缺陷。
技术领域
本发明属于生物技术信息领域,尤其涉及一种转录本的分类方法。
背景技术
三代测序技术能够对全长转录本进行测序,不需要进行碱基序列的读长拼接,可以避免拼接导致的碱基错误,因此,三代测序技术可以获得样本的全长转录本信息。一个基因转录出来的初始转录本正因为有不同的剪切方式,才形成了不同种类的成熟转录本(mRNA)。通过和现有已知的基因组的注释文件进行比较,根据转录本剪切位点位置信息的不同,有新剪切位点的转录本即可被认为是新的转录本。
目前现有确定新转录本的技术仅是通过比较外显子的重叠,没有准确定位到剪切位点,这就会导致原本是新的转录本被误判为已知的转录本。如图1所示,转录本a的3号外显子被参考基因组的3号外显子完全覆盖,但明显看出转录本a的3号外显子出现了不同的内含子剪切方式,形成了更短的外显子。同理,转录本b的4号外显子也出现了不同的剪切方式,形成了更长的外显子。正是因为这些因剪切位点的差异,才直接导致了新转录本的形成。但现有技术中,会把转录本a、b与参考基因组归为相同转录本。
现主流的软件为Matchannot和Gffcompare。Matchannot软件会把测得的转录本序列的文件和已有的基因组注释文件进行比较,然后根据每个转录本外显子的覆盖程度比较进行分类。比对上已知基因的转录本再根据匹配程度的不同,进行打分。而比对上未知位置的转录本直接被定义为“nogenefound”。其分析结果粗略,不明晰,得分在3分及以下的转录本比对模糊;缺乏二代数据的验证,最终获得的新转录本的假阳性率偏高;也没有对三代测序数据进行矫正。Gffcompare软件是利用测得的转录本序列文件与已有基因组注释文件进行比对,然后根据外显子的覆盖程度比较,把转录本分成了15个类别,种类繁多复杂。其结果粗略,分得的种类多而杂;对于参考基因组注释信息不是很完善的动植物物种,适用性低,结果差;没有对三代测序数据进行矫正。
发明内容
针对现有技术的不足,本发明提供了一种转录本分类方法,通过准确定位剪切位点,进而将转录本分成了9个类别,该方法分类准确,假阳性率很低,适用性广泛。
为了实现上述目的,本发明采用如下技术方案:
一种转录本分类方法,所述方法是通过准确定位剪切位点对转录本进行分类,具体包括以下步骤:
S1、对测序所得全长转录本结果质控,获得高质量全长转录本;
S2、将S1中获得的高质量全长转录本与参考基因组比对,将相同基因模型下的所有转录本进行聚类,去冗余,一个基因模型下的一种剪切模式只保留唯一最长的转录本;
S3、根据剪切位点,对全长转录本进行分类,获得初步分类结果;
S4、过滤初步分类结果,获得最终分类结果。
进一步地,在上述技术方案中,步骤S1所述全长转录本结果通过三代测序技术得到,所述质控方法具体为:筛选原始下机数据中碱基准确率大于99.9%和全长片段数大于等于2的序列。
进一步地,在上述技术方案中,步骤S2所述聚类具体为:根据3'端的外显子和剪切位点的完全匹配对相似转录本进行聚类。
进一步地,在上述技术方案中,还可以通过参考基因组序列对步骤S2所得的唯一最长的转录本序列进行碱基序列的矫正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉希望组生物科技有限公司,未经武汉希望组生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910388054.2/2.html,转载请声明来源钻瓜专利网。