[发明专利]基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法有效
| 申请号: | 201911288051.8 | 申请日: | 2019-12-15 |
| 公开(公告)号: | CN111192627B | 公开(公告)日: | 2022-09-06 |
| 发明(设计)人: | 於东军;李阳;朱一亨 | 申请(专利权)人: | 南京理工大学 |
| 主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B30/10 |
| 代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
| 地址: | 210094 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 碱基 嵌入 直接 相关 分析 核糖核酸 接触 预测 方法 | ||
1.一种基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法,其特征在于,包括以下步骤:
步骤1、碱基的嵌入法表示:对于给定核糖核酸多序列联配中的每条序列的每一个碱基,先通过多项式分布进行表示,再与一个可训练的嵌入参数矩阵E进行相乘,得到对应的向量表示;
步骤2、基于伪极大似然的直接相关模型构建:构建耦合参数矩阵J,对于核糖核酸多序列联配中的每个位置,基于所有不包括该位置的其他位置的嵌入法的向量表示和耦合参数相乘,从而得到该位置概率分布的预测;核糖核酸序列的概率近似表示为所有位置预测的概率分布的乘积;
步骤3、使用自适应随机梯度下降方法优化模型:损失函数为预测的核糖核酸序列的概率分布和给定核糖核酸多项式概率分布的距离;优化对象为该模型中的嵌入参数和耦合参数;
步骤4、接触图提取及后处理:从训练得到的耦合参数中提取接触图,通过后处理步骤消除接触图中的噪声。
2.根据权利要求1所述的预测方法,其特征在于:所述步骤1中,对于给定的核糖核酸多序列联配,使用一个嵌入参数矩阵E对现有多序列联配中的每个碱基的表示进行变换,用于表示氨基酸的向量是一个多项式分布,向量的维度D是事先指定超参数。
3.根据权利要求1所述的预测方法,其特征在于:所述步骤2中,对核糖核酸多序列联配中每一个碱基进行嵌入法表示后,在新的特征空间中,使用伪极大化似然的直接相关分析方法对核糖核酸多序列联配进行建模;每个位置预测的碱基类型概率分布为其中代表多序列联配中第n个位置为碱基类型q的概率;a\i表示多序列联配中的其它位置;J为可训练的耦合参数。
4.根据权利要求1所述的预测方法,其特征在于:所述步骤3中,利用自适应学习速率的随机梯度下降算法对该模型进行优化,得到参数E和J。
5.根据权利要求1所述的预测方法,其特征在于:所述步骤4中,从训练得到的耦合参数J中提取出给定多序列联配中任意两个位置的接触打分C;使用基于平均积矫正的后处理技术对C进行去噪。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911288051.8/1.html,转载请声明来源钻瓜专利网。





