[发明专利]基于卷积门控递归神经网络的RNA基元位点预测方法及系统在审
申请号: | 202110265412.8 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112863597A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 黄德双;申圳 | 申请(专利权)人: | 同济大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G06N3/08;G06N3/04 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 王颖 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 门控 递归 神经网络 rna 基元位点 预测 方法 系统 | ||
1.基于卷积门控递归神经网络的RNA基元位点预测方法,其特征包括以下步骤:
S1.基于RNA序列的碱基,依据所述碱基的对应字母,构建RNA序列字母表数据集,通过采用独热编码的方法,依据所述RNA序列字母表数据集,构建RNA字符序列数据集,基于所述RNA序列字母表数据集和RNA字符序列数据集,构建RNA数字序列矩阵转换模型;
S2.基于所述碱基的基元长度,获得基元长度数据集合,通过对所述RNA数字序列矩阵转换模型的矩阵元素相乘,获得矩阵元素特征值;
S3.基于所述基元长度数据集合、矩阵元素特征值,通过选择基元长度数据集合的任一基元长度元素作为卷积核大小,依据模型激活函数,构建多尺度卷积模型;
S4.基于所述碱基的基元与所述基元的上游子序列的第一调控关系,构建正向学习网络模型,基于所述基元与所述基元的下游子序列的第二调控关系,构建反向学习网络模型,依据所述正向学习网络模型和反向学习网络模型,构建双向门控递归神经网络模型;
S5.通过第一激活函数构建第一全连接层,通过第二激活函数构建第二全连接层,基于所述第一全连接层和第二全连接层,构建输出模型;
S6.将所述RNA数字序列矩阵转换模型与多尺度卷积模型的数据输入端连接,将所述多尺度卷积模型的数据输出端通过所述双向门控递归神经网络模型与所述输出模型连接,构建多尺度卷积门控递归神经网络模型,用于预测所述RNA序列的RNA基元位点。
2.如权利要求1所述基于卷积门控递归神经网络的RNA基元位点预测方法,其特征在于:
所述RNA序列字母表数据集包括字母表,所述字母表的大小为4;
所述RNA字符序列数据集包括字符序列,所述字符序列的字符向量长度为4;
通过所述字符序列,依据所述字符向量长度,构建参照矩阵,基于所述参照矩阵和所述RNA序列字母表数据集,构建所述RNA数字序列矩阵转换模型。
3.如权利要求2所述基于卷积门控递归神经网络的RNA基元位点预测方法,其特征在于:
所述RNA数字序列矩阵转换模型包括RNA数字序列,所述RNA数字序列的表达式为:RS=[C1,C2,C3,……,CL],Ci∈[1,4],i∈[1,L],L表示RNA序列长度;
所述RNA数字序列矩阵转换模型的公式为:
Ri=RM[ci],Ri∈Rd
R=[R1,R2,R3,.....,Rl],R∈Rd×l
其中,Ri表示从参考矩阵RM中获取的数字序列RS中的第i个元素ci对应的向量;R表示汇总Ri生成的一个大小为4×l的矩阵。
4.如权利要求1所述基于卷积门控递归神经网络的RNA基元位点预测方法,其特征在于,
所述多尺度卷积模型的表达式为:
其中,Θ表示基元长度的集合;j是Θ集合中的一个元素,代表当前卷积操作中卷积核的大小,符号表示矩阵元素相乘,α代表模型使用的激活函数,E表示选中的数据,Kj表示大小为j的卷积核,b表示一个卷积运算时的偏置项,i表示选中数据的起始位置,*表示选中数据的内容。
5.如权利要求1所述基于卷积门控递归神经网络的RNA基元位点预测系统,其特征在于,
所述输出模型的实现公式为:
h=max(0,WTx+b)
其中,x代表输入数据;W表示第一个全连接层的参数,WT是参数W的转置;b代表计算时使用的偏置项;h表示第一个全连接层的输出;p表示经过计算得出的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110265412.8/1.html,转载请声明来源钻瓜专利网。