[发明专利]采用改进花授粉算法识别关键蛋白质的方法有效
申请号: | 201711039345.8 | 申请日: | 2017-10-30 |
公开(公告)号: | CN107885971B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 雷秀娟;方铭;代才 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B25/10;G16B5/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 强宏超 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采用 改进 授粉 算法 识别 关键 蛋白质 方法 | ||
本发明公开了一种采用改进花授粉算法识别关键蛋白质的方法,将蛋白质相互作用网络转化为无向图、选取度最大的前Q个蛋白质作为花粉个体、度量PeC中心性、确定复合物信息、确定亚细胞定位信息,评价花粉重要性、更新花粉位置、输出识别的关键蛋白质;本发明在评价花粉重要性时不仅考虑了蛋白质网络的拓扑属性,而且融合了蛋白质网络的生物特性,能准确地识别关键蛋白;仿真实验结果表明,正确率、特异性、敏感度等指标性能较优;与其他关键蛋白识别方法相比,结合蛋白质网络的拓扑属性和生物特性,实现关键蛋白质识别过程,提高了关键蛋白的识别准确率。
【技术领域】
本发明属于生物信息领域,涉及一种蛋白质相互作用网络中关键蛋白质的识别方法,具体涉及一种采用改进花授粉算法识别关键蛋白质的方法。
【背景技术】
关键蛋白质是细胞生命活动中所必需的蛋白质,关键蛋白质的缺失会导致有关蛋白质复合物功能丧失,并导致生物体无法生存。由于关键蛋白质在生命活动中扮演重要角色,因此对于关键蛋白质的预测与识别成为一项重要研究工作,识别关键蛋白质对于研究细胞的生长调控过程具有重要意义。此外,在生物医学领域,关键蛋白质的识别对于致病基因的发现及药物标靶的鉴定具有重要意义,在疾病诊治和药物设计等方面具有重要的应用价值。
在生物学领域,一般利用基因敲除,RNA干扰等实验方法,例如单基因挑出和条件性基因剔除等,通过观察生物体的生存情况来辨别蛋白质的关键性,通过这些实验技术得到的结果虽然准确有效,但是代价高、效率低,并且适用的物种范围有限。近年来,随着酵母双杂交,串联亲和纯化和质谱分析等高通量的蛋白质组技术的发展,大量的蛋白质相互作用数据被检测出来,使得在网络水平上预测关键蛋白质成为可能,通过计算生物学的方法来预测关键蛋白质成为一个新的发展方向。
已有研究表明,蛋白质的关键性与它在生物网络中所对应结点的拓扑特性密切相关,因此,出现了一系列利用结点的中心性测度识别关键蛋白质的方法。结点的中心性测度通常用来衡量结点在网络中影响力的大小,评估结点所代表的对象获得、控制信息及资源的能力。基于结点中心性的关键蛋白质预测,主要是通过计算蛋白质网路中各蛋白质结点的中心性测度,按中心性测度值由大到小的顺序筛选出一定数量的蛋白质作为预测的关键蛋白质集合。
度中心性(degree centrality,DC)是最常用的一种中心性测度,一个结点的度中心性表示为与该结点直接相连的邻居结点的个数。Jeong等提出“中心性-致死性”法则(centrality-lethality rule),该法则显示一个蛋白质参与的相互作用越多,则它对细胞的生存也就越重要。除了度中心性以外,还有介数中心性、接近度中心性、子图中心性、特征向量中心性、信息中心性、局部平均联通性和边聚集系数之和。其中,结点的介数中心性(betweenness centrality,BC)表示网络中所有最短路径中经过该结点的数目占所有最短路径数的比例;结点的接近度中心性(closeness centrality,CC)为反比于该结点到网络中其他所有结点的最短路径之和;结点的子图中心性(subgraph centrality,SC)是该结点参与网络闭合回路的总数;结点的特征向量中心性(eigenvector centrality,EC)被定义为网络邻接矩阵的主特征向量该结点的分量;结点的信息中心性(informationcentrality,IC)是测量以该结点为端点的路径的调和平均长度;结点的局部平均联通性(local average connectivity,LAC)是指该结点的邻居结点彼此之间公共邻居结点的个数之和除以该结点的邻居结点的个数;结点的边聚集系数之和(sum of edge clusteringcoefficient,NC)是指该结点所有连接边的聚集系数之和。这8种中心性测度都已被用于生物网络中关键蛋白质的预测,且发现任何一个中心性测度的预测结果都远远好于随机选择的结果,从而证明蛋白质的关键性与其对应结点的中心性存在较为显著的相关性。
这些中心性方法仅仅依靠蛋白质相互作用数据识别关键蛋白质,预测的准确度比较依赖网络本身的可靠性,但蛋白质相互作用网络是通过高通量生物实验获得,包含了很多假阳性,很大地影响了关键蛋白质识别的准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711039345.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:鞍乘型车辆的收纳部结构
- 下一篇:一种具有固定水杯的碳纤维自行车架