[发明专利]lncRNA靶基因的预测分析方法、装置、设备和介质在审
申请号: | 202011294079.5 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112201304A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 马贝贝;黄龙 | 申请(专利权)人: | 上海美吉生物医药科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 李治东 |
地址: | 201321 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | lncrna 基因 预测 分析 方法 装置 设备 介质 | ||
1.一种lncRNA靶基因的预测分析方法,其特征在于,所述方法包括:
统计每个处理中重复的mRNA表达量之和,并根据表达量过滤掉表达量之和为零的mRNA序列;
对mRNA和lncRNA的表达量进行相关性分析,并提取对应的相关性系数和概率P值作为相关性评判标准,以合并去冗余并分别以mRNA文件和lncRNA文件进行存储;
对去冗余后的lncRNA序列按照指定序列数目进行拆分,以分别生成批量任务运行shell脚本,并提交至集群以实现多线程运行。
2.根据权利要求1所述的方法,其特征在于,所述对mRNA和lncRNA的表达量进行相关性分析中,根据样本数量的不同选择不同的相关性分析方法。
3.根据权利要求2所述的方法,其特征在于,所述根据样本数量的不同选择不同的相关性分析方法,包括:
若样本数量小于15,则通过R软件包Hmsic中的rcorr函数对mRNA和lncRNA的表达量进行相关性分析;
反之,若样本数量大于15,则通过加权共表达网络分析对mRNA和lncRNA的表达量进行相关性分析。
4.根据权利要求1所述的方法,其特征在于,所述提取对应的相关性系数和概率P值作为相关性评判标准,包括:默认提取P0.05的所有关联的基因,将关联基因合并去冗余后分别以mRNA和lncRNA储存。
5.根据权利要求1所述的方法,其特征在于,所述对去冗余后的lncRNA序列按照指定序列数目进行拆分,以分别生成批量任务运行shell脚本,并提交至集群以实现多线程运行,包括:
将拆分结果分别储存至不同fasta文件,并将每个fasta文件的绝对路径储存至list文件;
序列拆分成功后,按行读取list路径文件生成批量任务运行shell脚本,以提交至集群实现多线程运行。
6.根据权利要求1所述的方法,其特征在于,所述对去冗余后的lncRNA序列按照指定序列数目进行拆分,以分别生成批量任务运行shell脚本,并提交至集群以实现多线程运行,还包括:
对lncRNA序列拆分成不同模块,并分别与mRNA表达量进行相关性分析,形成多线程运行模式,提高分析时效。
7.一种电子装置,其特征在于,所述装置包括:
mRNA过滤模块,用于统计每个处理中重复的mRNA表达量之和,并根据表达量过滤掉表达量之和为零的mRNA序列;
相关性过滤模块,用于对mRNA和lncRNA的表达量进行相关性分析,并提取对应的相关性系数和概率P值作为相关性评判标准,以合并去冗余并分别以mRNA文件和lncRNA文件进行存储;
多线程处理模块,用于对去冗余后的lncRNA序列按照指定序列数目进行拆分,以分别生成批量任务运行shell脚本,并提交至集群以实现多线程运行。
8.一种计算机设备,其特征在于,所述设备包括:存储器、及处理器;所述存储器用于存储计算机指令;所述处理器运行计算机指令实现如权利要求1至6中任意一项所述的方法。
9.一种计算机可读存储介质,其特征在于,存储有计算机指令,所述计算机指令被运行时执行如权利要求1至6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海美吉生物医药科技有限公司,未经上海美吉生物医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011294079.5/1.html,转载请声明来源钻瓜专利网。