[发明专利]一种基于卷积神经网络的RNA-蛋白质结合位点预测方法有效
申请号: | 202111519617.0 | 申请日: | 2021-12-14 |
公开(公告)号: | CN113936738B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 潘正森;周树森;邹海林;柳婵娟;臧睦君;刘通;王庆军 | 申请(专利权)人: | 鲁东大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 264025 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 rna 蛋白质 结合 预测 方法 | ||
本发明属于生物信息学领域,涉及一种基于深度卷积神经网络的RNA‑蛋白质结合位点预测方法,其中包括卷积神经网络和RNA序列数据处理等技术,旨在提高卷积神经网络模型对RNA‑蛋白质结合位点的预测性能。首先,确定不同窗口长度,使用不同长度的窗口分别处理RNA序列;其次,把处理好的RNA序列通过单热编码方式编码成矩阵,针对多个单热编码矩阵训练多个卷积神经网络模型,并保存这些训练好的模型用于预测;最后,将需要预测的RNA序列经过处理后得到多个单热编码矩阵,分别输入对应的卷积神经网络模型得到多个预测概率,取多个模型预测概率的平均值作为预测结果。
技术领域
本发明属于生物信息学领域,涉及一种基于卷积神经网络的 RNA-蛋白质结合位点预测方法,其中包括卷积神经网络和 RNA 序列数据处理等技术。
背景技术
RNA 结合蛋白 (以下简称 RBPs) 在许多生物过程中发挥关键作用,例如:基因调控、mRNA 定位等。一些 RBPs 的突变可能会导致人类疾病。例如:RBPs FUS 和 TDP-43 的突变可导致肌萎缩性侧索硬化症。因此,解码 RBPs 可以对许多生物学机制有更深入的见解。
通过实验的方法检测 RBPs 耗时且昂贵。使用从现有注释知识中学习到的模式来计算预测 RBPs 是一种快速的方法。许多的计算方法已经被提出,神经网络和支持向量机等相关方法已经被成功的应用于预测 RBPs。
本发明最重要的创新点是提出了一种新的提取 RNA 序列结合信息的方法,即通过不同长度的窗口分别处理 RNA 序列,使得模型可以提取更丰富的序列结合信息,提高模型预测 RNA-蛋白质结合位点的性能。
发明内容
一种基于卷积神经网络的RNA-蛋白质结合位点预测方法,包括预处理RNA序列、训练卷积神经网络和测试卷积神经网络三个过程,其具体步骤如下:
步骤1、为了从RNA序列中提取更多的结合信息,需要使用
步骤2、使用
步骤3、把步骤2中使用
步骤4、把步骤3中生成的
步骤5、保存训练好的
步骤6、使用步骤5中保存好的模型来预测输入的RNA序列数据。
一种基于卷积神经网络的RNA-蛋白质结合位点预测方法,步骤1的实现过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鲁东大学,未经鲁东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111519617.0/2.html,转载请声明来源钻瓜专利网。