[发明专利]一种蛋白质互作网络共定位共表达复合物识别系统及方法在审
申请号: | 202010204246.6 | 申请日: | 2020-03-21 |
公开(公告)号: | CN111370060A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 张锦雄;钟诚 | 申请(专利权)人: | 广西大学 |
主分类号: | G16B25/00 | 分类号: | G16B25/00;G16B40/00 |
代理公司: | 重庆市信立达专利代理事务所(普通合伙) 50230 | 代理人: | 陈炳萍 |
地址: | 530004 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蛋白质 网络 定位 表达 复合物 识别 系统 方法 | ||
本发明属于蛋白质复合物识别技术领域,公开了一种蛋白质互作网络共定位共表达复合物识别系统及方法,包括:数据提取模块、矩阵数据生成模块、识别评价模块、核心挖掘模块、附件添加模块、复合物筛选模块。所述蛋白质复合物识别方法包括:将蛋白定位数据、基因表达数据、蛋白质间互作数据及蛋白质GO相似数据按矩阵方式组织;基于核心‑附件结构采用种子扩张策略识别具联合共定位联合共表达蛋白质复合物。本发明从蛋白质相互作用网络中发现蛋白质复合物,不仅有利于理解蛋白质网络的拓扑结构,而且有利于了解复合物所包含的生物意义,对预测未知蛋白质的功能及疾病靶向药物设计也具有相当重要的作用。
技术领域
本发明属于蛋白质复合物识别技术领域,尤其涉及一种蛋白质互作网络共定位共表达复合物识别系统及方法。
背景技术
随着后基因组时代的到来,蛋白质组就成为了研究者们又一个重要的研究内容。在细胞中,蛋白质很少单独起作用,它必须与其它蛋白质绑定在一起发生相互作用才能实现其生物功能。在所有生命活动中,蛋白质间相互作用(Protein Protein Interaction,PPI)是必不可少的,它是细胞进行一切代谢活动的基础。因此,揭示蛋白质间相互作用关系、建立相互作用关系的网络图,已成为蛋白质组学研究中的热点,也是后基因时代的难题所在。在各种生物网络中,蛋白质相互作用网络(PPINetworks,PPIN)是构成细胞功能的基础,掌控着大量的生命过程,对蛋白质间相互作用的非正常扰动引发的调控异常是许多疾病的主要起因,因此蛋白质相互作用网络逐渐成为从分子层面揭示疾病机理的主要工具。
蛋白质是基因表达的产物,是生物体生理功能的执行者,也是生命现象的直接体现者。蛋白质组学是对蛋白质所含特性进行系统化研究的学科,能为生物系统在健康和疾病状态下的结构、功能和调控提供详细的描述。几乎所有的生物过程,都是通过一系列的蛋白质相互作用完成的。从系统生物学的角度,利用蛋白质相互作用网络研究和分析生物功能具有重要的前景和实用价值。蛋白质复合物是在相同时间和空间通过相互作用组成的一个多分子机制的蛋白质集合,它是蛋白质执行其功能的主要形式。识别蛋白质复合物不仅有利于理解复杂的生命活动,同时为发现复杂疾病生成机理和设计靶向药物提供有价值的理论参考。
目前,蛋白质复合物的挖掘方法大致可以分为3类:一是基于传统图理论的识别方法,例如:基于划分方式聚类的RNSC算法,基于密度方式聚类的MCODE算法,基于层次方式聚类的GN算法,上述方法能够节省一定的时间成本,但由于对聚类中心、数据、参数等比较敏感,会在一定程度上影响算法的整体效率;二是基于多组学数据融合的识别方法,该类方法通常是将生物信息数据整合到现有的蛋白质网络中,增强网络的精确度与可靠度,从而弥补相互作用数据中存在的假阳性与假阴性等问题,但不可避免的局限性难以满足算法的性能要求;三是基于智能优化的识别方法,该类方法通过模拟自然界生物的各种群体行为,利用个体间的交互合作,寻找所求问题的近似最优解展现出良好的性能,例如蚁群优化算法、粒子群优化算法等,但是上述方法耗时耗力,收敛速度慢,搜索效率低并且容易陷入局部最优。
同时,通过已有的蛋白质相互作用数据(PPIData)构建蛋白质相互作用网络(PPIN),并从PPIN中发现有意义的子结构,如蛋白质复合物(Complex)、功能模块(FunctionalModule)和模体(Motif)等,已成为国内外研究的热点。为了更加方便地从蛋白质相互作用网络中发现这些子结构,通常的做法是采用图的形式表示蛋白质相互作用网络,将蛋白质看作顶点,蛋白质间的相互作用看作边,然后利用各种算法来挖掘具生物意义子结构--蛋白质复合物(Complex)。
综上所述,现有技术存在的问题是:
(1)现有基于传统图理论的识别方法由于对聚类中心、数据、参数等比较敏感,会在一定程度上影响算法的整体效率,准确率低。
(2)现有基于多组学数据融合的识别方法不可避免的局限性是难以满足算法的性能要求,准确率低。
(3)现有基于智能优化的识别方法耗时耗力,收敛速度慢,搜索效率低并且容易陷入局部最优。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010204246.6/2.html,转载请声明来源钻瓜专利网。