[发明专利]基于卷积门控递归神经网络的RNA基元位点预测方法及系统在审
申请号: | 202110265412.8 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112863597A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 黄德双;申圳 | 申请(专利权)人: | 同济大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G06N3/08;G06N3/04 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 王颖 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 门控 递归 神经网络 rna 基元位点 预测 方法 系统 | ||
本发明公开了基于卷积门控递归神经网络的RNA基元位点预测方法及系统,包括嵌入层模块、多尺度卷积层模块、双向门控递归神经网络层模块、输出层模块;系统通过嵌入层模块将RNA序列转化为RNA数字序列;基于多尺度卷积层模块从RNA数字序列中学习不同长度基元的局部绑定特征信息并从中挑选出第一主要特征信息;通过双向门控递归神经网络层模块学习第一主要特征信息中的RNA数字序列的当前基元位点与其上下游子序列间的调控关系;基于输出层模块根据第一主要特征信息和调控关系,生成第二主要特征信息,用于预测RNA序列的RNA基元位点,本发明实现了RNA基元位点的准确预测。
技术领域
本发明属于RNA基元定位识别技术领域,涉及基于卷积门控递归神经网络的RNA基元位点预测方法及系统。
背景技术
基核糖核酸(RNA)是一种由DNA转录合成的生物大分子,主要功能是将DNA中遗传信息转化为具有特定生物功能的蛋白质。在基因表达的翻译阶段,RNA深度参与了遗传信息编解码、蛋白质合成、翻译调控等多个生物过程。RNA调控功能的发挥依赖于其自身与蛋白质的绑定,并且现有的研究已经证实RNA与蛋白质的绑定在细胞氧化应激反应、肠道分化、细胞极化、细胞周期调控以及肠道干细胞标志物表达等生物过程中发挥重要作用。研究人员将能够与RNA序列绑定的蛋白质称为RNA绑定蛋白质(RNABindingProtein,RBP),RNA序列中只有部分区域能够与RBP绑定,这部分区域被称为RNA-蛋白质绑定位点或RNAmotif。准确预测RNA与RBP的绑定位点能够帮助研究人员深入理解基因表达过程中的转录后调控机制及其与复杂生命活动的关系。
尽管PAR-CLIP、CLIP-Seq等高通量测序技术的出现为RNA基元的鉴别提供了极大的便利,但是使用这些技术需要耗费大量的资源。此外,由于技术本身存在的缺陷,上述高通量测序技术产生的实验数据包含有假阳性信息、假阴性信息,研究人员同样需要耗费大量的时间从原始实验数据中识别剔除这些信息。另一方面,这些技术提供了大量经过验证的与RNA-蛋白质绑定相关的高通量数据,这些数据可以用作训练和测试预测模型的评估标准。如何快速准确地从实验数据中鉴别RNA基元位点已成为研究人员面临的巨大挑战。在图像识别、语音识别等领域,传统机器学习方法能够有效排除噪声信息干扰,准确实现任务目标,因此研究人员根据生物数据的特点对传统机器学习方法进行修改,利用改进后的方法对实验数据进行建模分析,预测RNA与蛋白质的绑定位点。例如,传统方法Oli从RNA序列数据中学习四核苷酸频率特征,利用支持向量机预测RNA与蛋白质绑定位点
尽管GraphProt也是用支持向量机进行预测,但GraphProt在特征学习时同时使用了RNA序列特征和结构特征。实验结果表明,这些方法具有良好的预测性能,也再次证明利用改进后的机器学习方法对可靠实验数据进行建模分析得到的计算模型能够较好地完成RNA基元位点预测任务。
深度学习模型具有优异的特征分析学习能力、泛化性能好等特性,其在自然语言处理、计算机视觉、语音识别等领域得到广泛应用。为了克服传统预测方法噪声敏感、时间复杂度高等缺陷,研究人员开始尝试使用基于深度学习的模型进行基因组序列分析任务。Babak等人提出的DeepBind模型是首个将卷积神经网络用于DNA/RNA序列特异性分析的深度学习模型,实验结果表明,该模型在相关任务中的性能优于现有的传统计算方法。Zhou等人提出的DeepSea模型使用多层卷积神经网络从序列数据中学习预测基因组序列非编码区变异的影响。与图像分类任务类似,基于深度学习的模型将基因组序列基元预测任务视为一个二分类问题,也就是对当前序列是否含有基元位点进行判别。RNA序列主要由A、C、G、U四种基本元素构成,因此上述模型使用独热编码(one-hot)将RNA序列转化为CNN能够处理的形式,然后利用CNN对输入的RNA数据进行建模分析,进而实现RNA基元位点的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110265412.8/2.html,转载请声明来源钻瓜专利网。