[发明专利]基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法有效

专利信息
申请号: 201911288051.8 申请日: 2019-12-15
公开(公告)号: CN111192627B 公开(公告)日: 2022-09-06
发明(设计)人: 於东军;李阳;朱一亨 申请(专利权)人: 南京理工大学
主分类号: G16B15/00 分类号: G16B15/00;G16B30/10
代理公司: 南京理工大学专利中心 32203 代理人: 王玮
地址: 210094 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 碱基 嵌入 直接 相关 分析 核糖核酸 接触 预测 方法
【权利要求书】:

1.一种基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法,其特征在于,包括以下步骤:

步骤1、碱基的嵌入法表示:对于给定核糖核酸多序列联配中的每条序列的每一个碱基,先通过多项式分布进行表示,再与一个可训练的嵌入参数矩阵E进行相乘,得到对应的向量表示;

步骤2、基于伪极大似然的直接相关模型构建:构建耦合参数矩阵J,对于核糖核酸多序列联配中的每个位置,基于所有不包括该位置的其他位置的嵌入法的向量表示和耦合参数相乘,从而得到该位置概率分布的预测;核糖核酸序列的概率近似表示为所有位置预测的概率分布的乘积;

步骤3、使用自适应随机梯度下降方法优化模型:损失函数为预测的核糖核酸序列的概率分布和给定核糖核酸多项式概率分布的距离;优化对象为该模型中的嵌入参数和耦合参数;

步骤4、接触图提取及后处理:从训练得到的耦合参数中提取接触图,通过后处理步骤消除接触图中的噪声。

2.根据权利要求1所述的预测方法,其特征在于:所述步骤1中,对于给定的核糖核酸多序列联配,使用一个嵌入参数矩阵E对现有多序列联配中的每个碱基的表示进行变换,用于表示氨基酸的向量是一个多项式分布,向量的维度D是事先指定超参数。

3.根据权利要求1所述的预测方法,其特征在于:所述步骤2中,对核糖核酸多序列联配中每一个碱基进行嵌入法表示后,在新的特征空间中,使用伪极大化似然的直接相关分析方法对核糖核酸多序列联配进行建模;每个位置预测的碱基类型概率分布为其中代表多序列联配中第n个位置为碱基类型q的概率;a\i表示多序列联配中的其它位置;J为可训练的耦合参数。

4.根据权利要求1所述的预测方法,其特征在于:所述步骤3中,利用自适应学习速率的随机梯度下降算法对该模型进行优化,得到参数E和J。

5.根据权利要求1所述的预测方法,其特征在于:所述步骤4中,从训练得到的耦合参数J中提取出给定多序列联配中任意两个位置的接触打分C;使用基于平均积矫正的后处理技术对C进行去噪。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911288051.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top