[发明专利]lncRNA靶基因的预测分析方法、装置、设备和介质在审
申请号: | 202011294079.5 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112201304A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 马贝贝;黄龙 | 申请(专利权)人: | 上海美吉生物医药科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 李治东 |
地址: | 201321 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | lncrna 基因 预测 分析 方法 装置 设备 介质 | ||
本申请提供的一种lncRNA靶基因的预测分析方法、装置、设备和介质,通过统计每个处理中重复的mRNA表达量之和,并根据表达量过滤掉表达量之和为零的mRNA序列;对mRNA和lncRNA的表达量进行相关性分析,并提取对应的相关性系数和概率P值作为相关性评判标准,以合并去冗余并分别以mRNA文件和lncRNA文件进行存储;对去冗余后的lncRNA序列按照指定序列数目进行拆分,以分别生成批量任务运行shell脚本,并提交至集群以实现多线程运行。本申请设置过滤方法减少lncRNA待预测的靶基因数量,减少了lncRNA靶基因预测假阳性率,从去除假阳性和多线程角度优化提升lncRNA靶基因预测效率。
技术领域
本发明涉及基因预测技术领域,特别是涉及一种lncRNA靶基因的预测分析方法、装置、设备和介质。
背景技术
lncRNA是一种序列长度大于200bp的长链非编码RNA序列,以RNA方式结合DNA及转录翻译中间产物,然后参与调控转录干扰、转录激活、蛋白表达等多个重要生物过程。现有研究对lncRNA调控模式的探索尚无重要发现。因此,lncRNA靶基因预测目前成为lncRNA功能性研究的关键。
预测方法是对已预测的lncRNA序列锚定其特定mRNA作为该lncRNA的靶基因,然后通过靶基因功能对lncRNA功能定性注释。基于此,lncRNA靶基因的精确定位成为lncRNA研究的一项重要内容,而准确高效的靶基因预测成为生物信息技术上的关键。
目前lnRNA靶基因预测分为cis作用靶基因预测和trans作用靶基因预测两种主要方向。cis作用靶基因预测是对lncRNA上下游一定范围内共表达蛋白编码基因的预测和功能富集;而trans靶基因预测是基于共表达和序列相似度对lncRNA靶基因预测。两种预测的差异在于是否基于距离算法,trans靶基因预测中认为靶基因与lncRNA位置不相关。
但是,序列相似度分析是基于能量值计算,需要对序列间相似度进行比对,运算量很大。目前基于能量值的已有lncRNA预测软件预测速度均较慢,预测时间随序列数呈线性增加,根据近期研究结果表明,基于算法优化上的lncRNA预测速度提升已达到瓶颈状态,trans靶基因预测基于序列相似度的评估的算法的预测速度较慢,使得预测效率上存在限制;另外,基于表达量相关性的预测分析准确度相对降低。仅从统计学方法上,对两个基因的表达量进行相关性分析,在表达量较低的基因中容易出现假阳性。
发明内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种lncRNA靶基因的预测分析方法、装置、设备和介质,以解决现有技术中的问题。
为实现上述目的及其他相关目的,本申请提供一种lncRNA靶基因的预测分析方法,所述方法包括:统计每个处理中重复的mRNA表达量之和,并根据表达量过滤掉表达量之和为零的mRNA序列;对mRNA和lncRNA的表达量进行相关性分析,并提取对应的相关性系数和概率P值作为相关性评判标准,以合并去冗余并分别以mRNA文件和lncRNA文件进行存储;对去冗余后的lncRNA序列按照指定序列数目进行拆分,以分别生成批量任务运行shell脚本,并提交至集群以实现多线程运行。
于本申请的一实施例中,所述对mRNA和lncRNA的表达量进行相关性分析中,根据样本数量的不同选择不同的相关性分析方法。
于本申请的一实施例中,所述根据样本数量的不同选择不同的相关性分析方法,包括:若样本数量小于15,则通过R软件包Hmsic中的rcorr函数对mRNA和lncRNA的表达量进行相关性分析;反之,若样本数量大于15,则通过加权共表达网络分析对mRNA和lncRNA的表达量进行相关性分析。
于本申请的一实施例中,所述提取对应的相关性系数和概率P值作为相关性评判标准,包括:默认提取P0.05的基因,将关联基因合并去冗余后分别以mRNA和lncRNA储存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海美吉生物医药科技有限公司,未经上海美吉生物医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011294079.5/2.html,转载请声明来源钻瓜专利网。