[发明专利]基于高通量测序技术的宿主中病毒来源sRNA数据分析方法有效
申请号: | 202110354949.1 | 申请日: | 2021-04-01 |
公开(公告)号: | CN113066532B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 肖云平;徐天生;杨雨晴;刘钰钏;史贤俊;林博 | 申请(专利权)人: | 上海欧易生物医学科技有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B30/10;G16B45/00 |
代理公司: | 上海德禾翰通律师事务所 31319 | 代理人: | 夏思秋 |
地址: | 201114 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 通量 技术 宿主 病毒 来源 srna 数据 分析 方法 | ||
1.一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,包括如下步骤:
(1)文件准备步骤:
准备config文件,读取后用于进行数据自动化质控以及后续数据分析;
(2)下机数据质控步骤:
将下机得到的原始数据去除接头,保留15-41nt长度的序列,然后过滤低质量序列;对去除接头的序列做质控,汇总包括序列的测序质量统计、GC含量统计的质控信息;对去除接头的序列做去除低质量碱基处理,然后对上述去除低质量碱基的序列做N碱基检测,若序列中含有一个及以上的N碱基则将这条序列剔除;然后将剔除含N碱基的序列转成fasta格式的序列文件,将过滤后的数据进行去重,获得无重复的序列,并标记所有序列的数量;同时对原始数据和过滤数据量进行统计,并以柱状图展示各个样本不同长度序列的数量分布特征;过滤序列用于后续分析;
(3)病毒参考基因组比对以及病毒sRNA注释步骤:
对参考基因组序列构建索引,将步骤(1)中去重后的序列与病毒参考基因组序列做比对,筛选出碱基错配数小于2的结果,比对上的序列认为是潜在的病毒来源sRNA,统计汇总序列和比对序列数信息;
(4)病毒sRNA定量步骤:
将步骤(3)中比对上参考基因组的序列数做统计,汇总序列和比对序列数信息,并绘制各样本比对上参考基因组的序列在基因组上的分布情况,整理病毒sRNA的counts数,再基于counts数计算每个病毒sRNA的TPM,并生成病毒sRNA注释文件;
(5)差异病毒sRNA分析步骤:
根据步骤(4)中注释到的病毒sRNA信息以及表达量结果进行差异表达分析,筛选同时满足差异倍数和显著性的差异表达病毒sRNA,统计并展示可视化结果;
(6)宿主靶基因预测、富集分析步骤:
将步骤(5)中所述差异病毒sRNA与宿主mRNA序列进行宿主靶标预测,统计靶标结合位点信息,绘制结合位点示意图;
对步骤(6)中预测到的差异病毒sRNA宿主靶基因,基于宿主的GO、KEGG背景文件使用超几何分布检验计算方法进行GO功能和KEGG通路的富集分析,计算GO、KEGG条目在差异病毒sRNA的宿主靶基因中是否显著富集的P值,再对P值经BenjaminiHochberg多重检验纠正后得到FDR;针对富集结果做柱状图和气泡图统计,获得差异病毒sRNA可能参与影响的功能和代谢通路;
(7)网页版报告整理步骤:
根据结果一键化生成病毒sRNA分析的网页版报告,网页版报告对整个分析结果做汇总,并对每个分析步骤做描述和对应的图表展示以及弹窗式帮助文档。
2.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述文件准备步骤当中config文件包括:下机数据位置以及对应的样本分析名和分组名、用于差异分析的分组信息、差异倍数参数、生物学重复参数、参考基因组信息。
3.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,一个碱基错配比对上病毒参考基因组的序列认为是潜在的病毒来源sRNA,并展示序列在基因组上的分布情况。
4.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述过滤低质量序列为以5个碱基长度为窗口对原始序列进行搜索,当窗口中碱基的平均测序质量低于20时,将从窗口最前端开始的部分截断并舍弃。
5.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,使用Fastx-Toolkit软件将剔除含N碱基的序列转成fasta格式的序列文件。
6.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,使用DESeq或DESeq2软件进行差异表达分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海欧易生物医学科技有限公司,未经上海欧易生物医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110354949.1/1.html,转载请声明来源钻瓜专利网。