[发明专利]基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法有效
| 申请号: | 201911288051.8 | 申请日: | 2019-12-15 |
| 公开(公告)号: | CN111192627B | 公开(公告)日: | 2022-09-06 |
| 发明(设计)人: | 於东军;李阳;朱一亨 | 申请(专利权)人: | 南京理工大学 |
| 主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B30/10 |
| 代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
| 地址: | 210094 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 碱基 嵌入 直接 相关 分析 核糖核酸 接触 预测 方法 | ||
本发明公开了一种基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法,包括:步骤1、碱基的嵌入法表示;步骤2、在嵌入空间构建直接相关模型;步骤3、基于自适应随机梯度下降的模型优化;步骤4、接触图提取及后处理。该方法是现有基于直接相关分析方法的核糖核酸接触图预测方法的拓展,具有灵活性和高效性。
技术领域
本发明涉及生物信息学中预测核糖核酸碱基之间接触预测领域,具体地说,是一种基于嵌入技术和直接相关分析的具有高精度的高效蛋核糖核酸接触预测方法。
背景技术
核糖核酸(RNA)是生物生命系统中重要的组成部分之一。在中心法则中承担着重要作用。RNA在生物体内行使多种功能,例如,HIV病毒的遗传信息就是由RNA而非DNA携带。目前,国内外学者在生物信息学领域内对RNA的功能和结构的研究正在逐渐升温。一般来说,同蛋白质类似,RNA的序列决定了RNA的结构,而RNA的结构跟其功能也具有密切的关系。因此,越来越多的的研究人员开始关注RNA的二级结构和三级结构的预测。
目前,具有一级序列的信息的RNA已经大量获得,但是,通过实验方法测定其三维空间结构往往花费高,难度大。这就导致了已知序列信息和结构信息之间形成了巨大的鸿沟。通过生物信息学的手段对已知序列信息的RNA进行三维结构预测成为非常紧迫的任务。
现在一般方法都是通过统计物理学方法基于序列对RNA的二级结构进行预测,再通过二级结构对其三维结构的建模进行指导。但是二级结构的表示存在天然的缺陷,即RNA的二级结构不能表示所有在空间上接触的碱基对。也就是说,二级结构表示的仅仅是所有碱基之间接触的一个子集。
2016年,Caleb Weinreb等人在CELL期刊上刊出的文章3D RNA and FunctionalInteractions from Evolutionary Couplings中提出了一种从RNA多序列联配中通过直接相关分析(DCA)获得碱基之间联配得分的方法plmc。该方法打破了传统RNA二级结构表示的约束,在协助预测RNA三维结构过程中发挥了重要作用。
尽管上述RNA碱基接触预测方法取得了一定的成功,但挑战仍然存在。首先,现有的直接相关分析方法中碱基的表示方法是标签化的,碱基之间没有相关性。再者,现有的直接相关分析模型都是线性模型,无法对天然碱基之间更加复杂的非线性关系进行建模。此外,上述文章中的优化方法效率偏低,训练时间较长。
发明内容
本发明的目的在于提出一种包含新的直接相关分析模型的预测方法,该模型是对现有直接相关分析模型的一种拓展,在现有模型的接触上,加入了碱基类型嵌入的方法,该表示方法可以通过向量表示学习出碱基之间的语义关系。同时通过引入更加高效的优化算法,从而高效优化所提出的模型。
实现本发明目的的技术解决方案为:一种基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法,包括以下步骤:
步骤1、碱基的嵌入法表示:对于给定核糖核酸多序列联配中的每条序列的每一个碱基,先通过多项式分布进行表示,再与一个可训练的嵌入参数矩阵进行相乘,得到对应的向量表示;值得注意的是,由于该嵌入矩阵参数是可训练的,会根据给定的多序列联配自动学习,因此,不同的核糖核酸多序列联配学习得到的向量表示也不一样。
步骤2、基于伪极大似然的直接相关模型构建:构建耦合参数矩阵,对于核糖核酸多序列联配中的每个位置,基于所有不包括该位置的其他位置的嵌入法的向量表示和耦合参数相乘,从而得到该位置概率分布的预测。该核糖核酸序列的概率近似表示为所有位置预测的概率分布的乘积;
步骤3、使用自适应随机梯度下降方法优化模型:损失函数为预测的核糖核酸序列的概率分布和给定核糖核酸多项式概率分布的距离。优化对象为该模型中的嵌入参数和耦合参数。本方法可以认为是一种神经网络方法,但是该神经网络方法更加关注的是隐含层的参数,而非输出层的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911288051.8/2.html,转载请声明来源钻瓜专利网。





