[发明专利]一种基于多维关联特征的E3泛素连接酶-底物相互作用识别方法有效
申请号: | 201711305220.5 | 申请日: | 2017-12-11 |
公开(公告)号: | CN110021343B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 陈迪;朴海龙 | 申请(专利权)人: | 中国科学院大连化学物理研究所 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 马驰 |
地址: | 116023 *** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 关联 特征 e3 连接酶 相互作用 识别 方法 | ||
1.一种基于多维关联特征的E3泛素连接酶-底物相互作用识别方法,包括:
S1:获取多维关联特征计算所需的基础数据,收集E3泛素连接酶-底物相互作用集合及三类不同的对照集合;
S2:基于组学数据、蛋白质相互作用网络、通路多个方面计算两个蛋白质间的多维度关联特征;包括以下步骤:
S21:基于组学数据计算蛋白质间的表达关联;
S22:基于蛋白质网络计算蛋白质间的网络关联;
S23:基于通路信息计算蛋白质间的通路关联;
S3:基于所述多维关联特征对比E3泛素连接酶-底物相互作用与三类对照样本并构建三个随机森林分类器;包括如下步骤:
S31:基于E3泛素连接酶-底物相互作用集合和对照集合1利用随机森林算法构建分类器一;
S32:基于E3泛素连接酶-底物相互作用集合和对照集合2利用随机森林算法构建分类器二;
S33:基于E3泛素连接酶-底物相互作用集合和对照集合3利用随机森林算法构建分类器三;
S4:对三个分类器进行集成,构建E3泛素连接酶-底物相互作用识别模型,用于对E3泛素连接酶底物的预测;
所述步骤S1中的三类对照集合分别为:
对照集合1:5000对以上随机组合的E3泛素连接酶-非E3泛素连接酶蛋白质组合;
对照集合2:5000对以上随机选取的非E3泛素连接酶蛋白质-非E3泛素连接酶蛋白质相互作用;
对照集合3:5000对以上随机选取的E3泛素连接酶与非E3泛素连接酶蛋白质间间接调控关系,保证三个集合的条目数量相同且内容互不相互,没有重复;
所述S21中蛋白质间的表达关联计算包含如下步骤:
S211:基于转录组数据计算两个蛋白质转录水平间的Spearman相关系数
S212:基于蛋白质组数据计算两个蛋白质表达水平间的Spearman相关系数
所述S22中包括如下步骤:
S221:基于蛋白质交互作用网络
,
其中
S222:基于蛋白质交互作用网络
,
其中,
S223:基于蛋白质交互作用网络
,
其中,
所述步骤S23包含如下步骤:
S231:基于转录组数据计算蛋白质
,
其中Pi是蛋白质b所属的任意一条通路,,m代表通路Pi中的任意一个不同于a的蛋白质,
S232:基于蛋白质组数据计算蛋白质
,
其中,
S233:基于转录组数据计算蛋白质
,
其中Pj是蛋白质a所属的任意一条通路,
,
n代表通路Pj中的任意一个不同于b的蛋白质;
S234:基于蛋白质组数据计算蛋白质
,
,
所述步骤S4中对三类分类器的集成如下:
,
其中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院大连化学物理研究所,未经中国科学院大连化学物理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711305220.5/1.html,转载请声明来源钻瓜专利网。