[发明专利]核酸结构中核苷酸与核苷酸相互作用预测的方法在审
申请号: | 201910328024.2 | 申请日: | 2019-04-23 |
公开(公告)号: | CN110085282A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 赵蕴杰;简弋人;王晓囡;贾亚;曾辰 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B15/10;G16B40/30 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 艾小倩 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 核苷酸 核酸结构 预测 核酸 机器学习模型 三维结构特征 功能机理 核酸分子 机器模型 结合序列 进化关系 三级结构 三维结构 同源序列 预测结果 直接耦合 建模 进化 分析 帮助 研究 | ||
1.一种核酸结构中核苷酸与核苷酸相互作用预测的方法,其特征在于:它包括如下步骤:
(1)核酸序列和结构数据的选取:
该步骤中的核酸序列提取自核酸信息分类数据库Rfam,结构数据提取自核酸三级结构数据库RNA 3D HUB,version 3.21;
(2)受限玻尔兹曼机学习核酸结构特征:
首先将结构数据中的核酸结构以的距离截断,计算得到核苷酸与核苷酸相互作用数组;然后利用线性插值的方法,VGG-16,将长程空间结构相互作用数组统一调整到100x100的大小;进一步,将长程相互作用数组的下三角转换成一维数组,该数组中1表示核苷酸与核苷酸间有相互作用,0表示核苷酸与核苷酸间无相互作用;每个数值为1时相互作用或数值0时无相互作用均有一个通道,一维数组的元素将被输入到受限玻尔兹曼机的可见单元中;接着,利用随机梯度下降法和对比散度算法对受限玻尔兹曼机模型进行训练,学习率为0.1,训练次数为10000;保留产生的后5000个结构,计算5000个结构产生的核苷酸与核苷酸的相互作用概率,并以此作为核酸的三维结构特征;
受限玻尔兹曼机的能量表达式为
E(v,h|W,b,c)=-bTv-cTh-hTWv (1)
其中W是可见层单位v与隐藏层单位h之间的连接权重矩阵,h、b、c是作为补偿的偏置单元;v、h的概率给定如下:
z(W,b,c)=Εv,he-E(v,h|W,b,c) (3)
其中z(W,b,c)是对所有可能的v和h求和的配分函数;通过随机梯度下降(SGD)对经验数据的负对数似然进行受限玻尔兹曼机训练;L(W,c,b,T)定义为损失函数,希望它在SGD期间最小化
P(v|W,b,c)定义如下
P(v|W,b,c)=Εhp(v,h|W,b,c) (5)
T为样本数据;通过最小化损失函数,根据以下公式更新参数:W,b,c
上述利用线性插值的方法将结构数据中的核苷酸与核苷酸相互作用数组统一调整到100x100的大小,并将数组的下三角转换成一维数组;
上述利用的距离截断标准计算核酸三级结构中的核苷酸与核苷酸相互作用;
上述利用随机梯度下降法SGD和对比散度CD算法对受限玻尔兹曼机模型进行训练,更新权重;
上述受限玻尔兹曼机模型学习率参数的设置为0.1;
(3)直接耦合分析模型预测序列共同进化:
在进行多序列比对即MSA时去除序列插空大于50%的序列,然后计算单个核苷酸和一对核苷酸的核苷酸频率;
其中两个位点之间相互作用强度的直接耦合定义为
借助一个孤立双位点模型
与由经验单核苷酸频率和定义;
(4)受限玻尔兹曼机与直接耦合分析模型相结合:
核苷酸与核苷酸相互作用预测结果综合了受限玻尔兹曼机学习的结构特征和直接耦合分析学习的序列共进化特征
DIRECT=DI×W2 (11)
其中,DIRECT为核苷酸与核苷酸预测结果,DI为直接耦合分析得到的序列共进化信息,W为受限玻尔兹曼机学习得到的结构特征;通过计算公式DIRECT=DI×W2综合受限玻尔兹曼机学习的结构特征和直接耦合分析学习序列的共进化特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910328024.2/1.html,转载请声明来源钻瓜专利网。