[发明专利]一种基于卷积神经网络和规划动态算法的RNA二级结构生成器及其预测方法有效
申请号: | 201810851933.X | 申请日: | 2018-07-30 |
公开(公告)号: | CN110021340B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 张浩;张春鹤;刘元宁;魏旭;常浩武;李聪 | 申请(专利权)人: | 吉林大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B30/10 |
代理公司: | 北京远大卓悦知识产权代理有限公司 11369 | 代理人: | 姜美洋 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 规划 动态 算法 rna 二级 结构 生成器 及其 预测 方法 | ||
本发明公开了一种基于卷积神经网络和规划动态算法的RNA二级结构生成器,包括:微处理器;存储单元,处理单元,其包括:预处理单元,负责获取缓存单元中RNA数据,并对所述RNA数据进行预处理;滑动窗口单元,其连接所述预处理单元,用于将经过预处理后的RNA数据分割为大小相同的RNA二维数组;卷积神经网络模型单元,其以前期收集的大量RNA测序及其结构数据为基础,构建卷积神经网络模型,对序列内各个碱基进行分类预测;规划动态算法单元,其用于修正卷积神经网络模型单元的预测结果,还公开了一种基于卷积神经网络和规划动态算法的RNA二级结构预测方法。
技术领域
本发明涉及生物信息学领域,涉及一种基于卷积神经网络和规划动态算法的RNA二级结构的生成器及预测方法。
背景技术
核糖核酸(缩写为RNA,即Ribonucleic Acid),存在于生物细胞以及部分病毒、类病毒中的遗传信息载体。RNA就是由核糖核苷酸经磷酸二酯键缩合而成长链状分子。RNA分子通过其结构来表现其功能,然而,RNA分子的三级结构较为复杂,缺少有效的表示方法对其进行描述。因此,一般情况下会通过RNA的二级结构来研究RNA的功能及特性。
二级结构以往是由生物大分子在原子量级结构下的氢键来定义的。在蛋白质,二级结构则是以主链中氨基之间的氢键模式来定义,亦即DSSP所定义的氢键,并不包括主链与旁链间或是旁链之间的氢键。而RNA的二级结构则是以碱基之间的氢键来定义。在很多RNA分子,二级结构对RNA正常功能非常重要,有时甚至于较序列重要。
现有的生物实验测定RNA二级结构的方法主要有X射线晶体衍射和 NMR等方法。通过生物实验方法可以得到较为精确的RNA二级结构,然而这种方法十分低效、昂贵,难以大批量测定其结构。因此,通过计算机算法对RNA二级结构进行模拟成为一种有效的途径。
通过计算机设计算法来预测RNA的二级结构的主要方法有两大类,一类是利用动态规划算法,算法在能量或其他限制条件的影响下,通过迭代递归的思想来对RNA二级结构进行预测。另一类是通过序列比对的方法,在已知结构的RNA数据库中找到其同源序列,通过与同源序列比对的方法来对未知结构的RNA来进行预测。
目前,深度学习在各大领域的预测问题上均有非常有效的结果。深度学习的方法可以在大规模数据中,通过构建深层网络来提取出有效的、隐含的特征,并利用这些特征构建出有效的预测模型。目前,深度学习的方法在蛋白质的二级结构预测领域已经有了较大的突破。因此,将深度学习方法应用到RNA二级结构预测领域成为一个新的研究领域。
发明内容
本发明设计开发了一种RNA二级结构生成器,自动提取出数据中有效的隐藏特征,对序列内各个碱基进行分类预测。
本发明还设计开发了一种RNA二级结构预测方法,使用规划动态算法对预测结果进行修正,利用这种方法可以排除能量对RNA二级结构预测结果的影响。
本发明提供的技术方案为:
一种基于卷积神经网络和规划动态算法的RNA二级结构生成器,包括:
微处理器;
存储单元,其包括:
内存储单元,其用于RNA初始数据的存储;
缓存单元,其连接所述内存储单元;
存储单元,其与所述缓存单元连接,用于完成所述RNA二级结构预测结果数据的存储;
处理单元,其包括:
预处理单元,其用于获取缓存单元中RNA数据,并对所述RNA数据进行预处理;
滑动窗口单元,其连接所述预处理单元,用于将经过预处理后的 RNA数据分割为大小相同的核苷酸序列二维数组;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810851933.X/2.html,转载请声明来源钻瓜专利网。