[发明专利]一种过滤全长转录本的方法和系统在审
| 申请号: | 202011619487.3 | 申请日: | 2020-12-30 |
| 公开(公告)号: | CN114694751A | 公开(公告)日: | 2022-07-01 |
| 发明(设计)人: | 封力;汤冬;刘山林;梁帆;汪德鹏 | 申请(专利权)人: | 武汉希望组生物科技有限公司 |
| 主分类号: | G16B25/00 | 分类号: | G16B25/00;G16B30/10;G16B40/00 |
| 代理公司: | 武汉河山金堂专利事务所(普通合伙) 42212 | 代理人: | 胡清堂 |
| 地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 过滤 全长 转录 方法 系统 | ||
本发明公开了一种过滤全长转录本的方法和系统,所述方法包括以下步骤:将测序获得的转录本读段与参考基因组进行比对,根据转录本剪切模式,进行聚类去冗余;根据平均测序深度、外显子支持数以及转录本读段支持数进行过滤;再与参考基因组重比对,再次聚类去冗余。所述系统用于执行所述过滤方法。本发明提供的方法和系统能够针对性的处理参考基因组中未知剪切模式的转录本,有效保留低丰度可信转录本,且过滤结果相较于现有技术均具备较高的灵敏性和准确性。
技术领域
本发明涉及生物信息技术领域,具体涉及一种过滤全长转录本的方法和系统。
背景技术
传统的基因表达研究,是在个体或者组织水平上展开,即将个体或者组织样本所包含的数百万或更多个细胞作为一个整体。但是,明显的,同一样本中不同类型的细胞、相同类型不同时期的细胞,其基因表达模式是不同的,主要体现在具体表达什么基因、同一个基因怎么表达(转录本的差异)以及具体基因表达了多少(即表达量差异)几个方面。平均化的传统基因表达研究明显无法解决这个技术问题,因此单细胞技术孕育而生。
2009年第一个单细胞转录组测序技术被成功开发(Tang F,Barbacioru C,WangY,et al.mRNA-Seq whole-transcriptome analysis of a single cell[J].NATUREMETHODS,2009,6(5):377-382.),随后Smart-Seq技术(Daniel,Luo,Shujun,Wang,Yu-Chieh,et al.Full-length mRNA-Seq from single-cell levels of RNA andindividual circulating tumor cells[J].Nature Biotechnology,2012,30(8):777-782.)、Smart-Seq2技术(Serra,Lorrayne,Chang,Dennis,Macchietto,Marissa,etal.Adapting the Smart-seq2 Protocol for Robust Single Worm RNA-seq[J].BioProtocol,2018,8(4).)的开发,10×Genomics Chromium(https://www.10xgenomics.com/)、Illumina Bio-Rad Single-Cell Sequencing Solution(https://www.bio-rad.com/)等商业化平台的推出,使得单细胞研究迅速发展。
现阶段,较成熟单细胞研究都是与第二代测序技术相结合。第二代测序技术(也称下一代测序技术),以短读长、高准确度、高通量、低价格为显著特征。根据二代测序数据(短读长读段)可以在基因层面进行比对,即确定每一条短读长读段与具体基因的关系。但是,由于每个基因在转录时存在多种剪切模式,产生不同转录本,受限于短读长,无法直接确定具体每一条短读长读段与转录本的关系。因此,第二代测序技术只能利用生物信息学算法进行拼接以获得转录本信息,其数据在可变剪切模式、转录本分类上的适用性非常有限。
第三代测序技术平台,以Pacific Biosciences和Oxford NanoporeTechnologies为代表,具有长读长的显著特点,为测序领域带来了重大的变革。作为新兴的应用方向,三代测序技术与单细胞技术的结合还有诸多技术问题。长读长测序比短读长测序技术具有更高的错误率和更低的测序深度。在数据分析时,如果使用传统的“一刀切”的处理方式,势必无法获得低深度但反应生物体真实转录情况的数据,而这些数据对于细胞水平的研究而言非常重要,它们很可能与单细胞的异质性相关。
发明内容
有鉴于此,本发明提供了一种过滤全长转录本的方法和系统,实现了对全长转录本数据的精确过滤,具备较高的准确性和灵敏性。
为了实现上述目的,本发明的技术方案具体如下:
一种过滤全长转录本的方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉希望组生物科技有限公司,未经武汉希望组生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011619487.3/2.html,转载请声明来源钻瓜专利网。





