[发明专利]一种基于多维关联特征的E3泛素连接酶-底物相互作用识别方法有效

专利信息
申请号: 201711305220.5 申请日: 2017-12-11
公开(公告)号: CN110021343B 公开(公告)日: 2023-05-12
发明(设计)人: 陈迪;朴海龙 申请(专利权)人: 中国科学院大连化学物理研究所
主分类号: G16B20/00 分类号: G16B20/00
代理公司: 沈阳科苑专利商标代理有限公司 21002 代理人: 马驰
地址: 116023 *** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 多维 关联 特征 e3 连接酶 相互作用 识别 方法
【权利要求书】:

1.一种基于多维关联特征的E3泛素连接酶-底物相互作用识别方法,包括:

S1:获取多维关联特征计算所需的基础数据,收集E3泛素连接酶-底物相互作用集合及三类不同的对照集合;

S2:基于组学数据、蛋白质相互作用网络、通路多个方面计算两个蛋白质间的多维度关联特征;包括以下步骤:

S21:基于组学数据计算蛋白质间的表达关联;

S22:基于蛋白质网络计算蛋白质间的网络关联;

S23:基于通路信息计算蛋白质间的通路关联;

S3:基于所述多维关联特征对比E3泛素连接酶-底物相互作用与三类对照样本并构建三个随机森林分类器;包括如下步骤:

S31:基于E3泛素连接酶-底物相互作用集合和对照集合1利用随机森林算法构建分类器一;

S32:基于E3泛素连接酶-底物相互作用集合和对照集合2利用随机森林算法构建分类器二;

S33:基于E3泛素连接酶-底物相互作用集合和对照集合3利用随机森林算法构建分类器三;

S4:对三个分类器进行集成,构建E3泛素连接酶-底物相互作用识别模型,用于对E3泛素连接酶底物的预测;

所述步骤S1中的三类对照集合分别为:

对照集合1:5000对以上随机组合的E3泛素连接酶-非E3泛素连接酶蛋白质组合;

对照集合2:5000对以上随机选取的非E3泛素连接酶蛋白质-非E3泛素连接酶蛋白质相互作用;

对照集合3:5000对以上随机选取的E3泛素连接酶与非E3泛素连接酶蛋白质间间接调控关系,保证三个集合的条目数量相同且内容互不相互,没有重复;

所述S21中蛋白质间的表达关联计算包含如下步骤:

S211:基于转录组数据计算两个蛋白质转录水平间的Spearman相关系数EC1(a,b)

S212:基于蛋白质组数据计算两个蛋白质表达水平间的Spearman相关系数EC2(a,b);

所述S22中包括如下步骤:

S221:基于蛋白质交互作用网络G计算蛋白质ab第一维度的网络关联中,如下:

其中Neis(a,G)、Neis(b,G)代表网络G中任意一个蛋白质a/b的邻居节点,|·|代表集合的大小;

S222:基于蛋白质交互作用网络G以及转录水平的共表达网络GCXNR计算蛋白质ab第二维度的网络关联,如下:

其中,HN(a, GCXNR)、HN(b, GCXNR)代表在网络GCXNR中任意蛋白质a、b的Spearman相关系数在阈值0.4以上的所有蛋白质的集合, Neis(HN(a, GCXNR), G)代表在蛋白交互作用网络G中蛋白质集合HN(a, GCXNR)的所有邻居节点的并集;

S223:基于蛋白质交互作用网络G以及蛋白质水平的共表达网络GCXNP计算蛋白质ab第三维度的网络关联,如下:

其中,HN(a, GCXNP)、HN(b, GCXNP)代表在网络GCXNP中任意蛋白质a、b的Spearman相关系数在阈值0.4以上的所有蛋白质的集合,Neis(HN(a,GCXNP), G)代表在蛋白交互作用网络G中蛋白质集合HN(aGCXNP)的所有邻居节点的并集;

所述步骤S23包含如下步骤:

S231:基于转录组数据计算蛋白质ab间的通路关联中的第一个维度,如下:

其中Pi是蛋白质b所属的任意一条通路,,m代表通路Pi中的任意一个不同于a的蛋白质,N(Pi)蛋白通路中蛋白质数目;

S232:基于蛋白质组数据计算蛋白质ab间的通路关联中的第二个维度,如下:

其中,

S233:基于转录组数据计算蛋白质ab间的通路关联中的第三个维度,如下:

其中Pj是蛋白质a所属的任意一条通路,

n代表通路Pj中的任意一个不同于b的蛋白质;

S234:基于蛋白质组数据计算蛋白质ab间的通路关联中的第四个维度,如下:

所述步骤S4中对三类分类器的集成如下:

其中auci代表第i个分类器的精度,probi(a,b)代表基于第i个分类器预测得到的蛋白ab之间属于E3泛素连接酶-底物相互作用的概率值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院大连化学物理研究所,未经中国科学院大连化学物理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711305220.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top