[发明专利]一种环状RNA鉴定和表达定量的分析方法有效
申请号: | 201911378692.2 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111192635B | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 沈立;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/30 |
代理公司: | 上海天翔知识产权代理有限公司 31224 | 代理人: | 吕伴 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 环状 rna 鉴定 表达 定量 分析 方法 | ||
本发明公开了一种环状RNA鉴定和表达定量的分析方法,其特征在于,包括一系列的测序数据过滤步骤、测序数据比对步骤、环状RNA连接点鉴定步骤、差异分析步骤、基因注释步骤和富集分析步骤来进行。本发明的分析方法可以帮助发现新的circRNA信息,进一步对环状RNA鉴定和表达定量分析。
技术领域
本发明涉及基因检测领域,具体涉及一种环状RNA鉴定和表达定量的分析方法。
背景技术
circRNA(circular RNA,环状RNA)是一类具有闭合环状结构的非编码RNA分子,没有5′帽子结构和3′poly(A)结构,主要位于细胞质或储存于外泌体中,不受RNA外切酶影响,表达更稳定且不易降解,已被证明广泛存在于多种真核生物体内。大多数circRNA是由外显子环化而成,也有部分circRNA是由内含子环化而成的套索结构(lariat)。同时由于circRNA含有大量的miRNA应答原件(MREs),能与AGO蛋白形成RNA诱导沉默复合体(RISC)的催化核心,最终导致circRNA降解。根据来源,circRNA可大致分为四类:全外显子型的circRNA,内含子和外显子组合的EIcircRNA,内含子组成的套索型ciRNA,由病毒RNA基因组、tRNA、rRNA、snRNA等环化产生的circRNA。
现有的基于芯片的circRNA分析方法,依赖于已知的circRNA信息,无法发现新的circRNA。
发明内容
为了克服现有技术的上述缺陷,本发明的目的在于提供一种环状RNA鉴定和表达定量的分析方法,所述方法适用于去除rRNA并且链特异性建库,或者去除线性RNA的RNASeq测序结果分析。
为了实现本发明的目的,所采用的技术方案是:
一种环状RNA鉴定和表达定量的分析方法,包括如下步骤:
步骤一,测序数据过滤步骤:
使用fastp软件去除测序结果中的接头和低质量序列:
fastp使用PE reads overlap信息自动识别接头序列,具体是:
同时以5个碱基长度为窗口,从3’端向5’端滑动,截去窗口内平均质量小于20的窗口。最后保留长度大于50的reads;
将去除接头和低质量序列后的测序数据采用fastqc软件进行质量控制。
步骤二,测序数据比对步骤:
首先从基因组数据库中下载对应物种的参考基因组,下载下来的基因组序列使用hisat2-build构建索引;
对于构建索引后的序列进行比对;
将比对完成的测序数据通过RSeQC进行质量控制;
步骤三,环状RNA连接点鉴定步骤:
对于比对不上基因组的序列,使用find_circ进行环状RNA连接点鉴定,所述的环状RNA连接点鉴定具体是:
先对于hisat2比对结果进行筛选,挑选没有比对结果和比对结果中出现大片段(10bp)soft-clip的reads进行二次比对;
接着挑选出的reads从两端分别截取20bp,使用bowtie2与基因组比对;如果两个序列比对的位置是相反的,这条Reads就可能来自一个CircRNA;
接着需要对这个CircRNA进行二次判断:
将Anchor序列一直延伸,如果到连接点处为止序列都能够与参考基因组完全匹配,并且连接点处的剪切模式符合AG-GT的剪切模式,就认定这是一个CircRNA;
步骤四,差异分析步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911378692.2/2.html,转载请声明来源钻瓜专利网。