[发明专利]一种植物与病原菌蛋白质相互作用的预测方法在审
申请号: | 202011020892.3 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112185459A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 张利达;郑存俭;刘源;孙方楠 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G16B15/30 | 分类号: | G16B15/30;G16B15/20;G16B50/30 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 叶敏华 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 植物 病原菌 蛋白质 相互作用 预测 方法 | ||
本发明涉及一种植物与病原菌蛋白质相互作用的预测方法,包括步骤:1)收集宿主‑病原菌蛋白质互作阳性数据;2)收集蛋白质复合体模板空间结构,分析亚基对的互作界面;3)将宿主‑病原菌蛋白质序列进行同源结构建模,获取蛋白质同源空间结构模型;4)将蛋白质同源空间结构与蛋白质复合体模板空间结构进行比对,获取结构特征;5)提取非结构特征;6)基于结构特征和非结构特征,搭建机器学习模型并测试调整,对基因组尺度的水稻‑稻瘟病菌蛋白质互作进行预测。与现有技术相比,本发明充分借助已测定的蛋白质结构数据,及同源、结构域互作等信息,能够有效、快速、简捷地提取植物‑病原菌蛋白质相关互作特征信息。
技术领域
本发明涉及生物数据处理技术领域,尤其是涉及一种植物与病原菌蛋白质相互作用的预测方法。
背景技术
植物与病原菌的相互作用是双向的生物交流过程。一方面植物试图识别病原菌分泌的分子以避免被感染,另一方面,病原菌会尽可能地操纵植物,从而使植物宿主环境对其更有利。这使得许多已知的物种内蛋白质相互作用预测方法不适用于植物-病原菌,也鲜有聚焦植物-病原菌蛋白质相互作用预测的研究。
目前虽已发展用于蛋白质相互作用的实验检测方法,但实验方法费时费力、数据累积量少,且这些数据大多数集中在人与病原体(尤其是病毒)之间的互作。相比之下,其他宿主,尤其是植物-病原菌蛋白质互作数据非常有限。
虽然从蛋白质空间结构角度非常容易解释蛋白质互作,但是蛋白质空间结构复杂,且已知结构的蛋白质数量有限,如何充分借助这些已测定的蛋白质结构数据,提取相关互作特征信息,已成为当前植物-病原菌相互作用亟待解决的关键问题。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种植物与病原菌蛋白质相互作用的预测方法,该方法借助已测定的蛋白质空间结构数据,以及同源、结构域互作等信息,能够有效、快速、简捷地提取植物-病原菌蛋白质相关互作特征信息。
本发明的目的可以通过以下技术方案来实现:
一种植物与病原菌蛋白质相互作用的预测方法,包括如下步骤:
S1、收集宿主-病原菌蛋白质互作阳性数据以及水稻、稻瘟病菌的基因组数据;
利用HPIDB数据库收集宿主-病原菌蛋白质互作阳性数据,所述宿主-病原菌蛋白质互作阳性数据满足通过酵母双杂交等蛋白质互作检测手段中至少一种实验方法测定获得。
从MSU数据库下载水稻的基因组数据,删除转座子基因;从Ensembl Genomes数据库下载稻瘟病菌的基因组数据,在TMHMM网站进行跨膜螺旋预测,选取预测的跨膜螺旋预测数量大于0的蛋白质;在SignalP网站进行信号肽预测,在WoLF PSORT网站进行亚细胞定位预测,类别为信号肽且定位在胞外的蛋白质属于稻瘟病的分泌蛋白;去除各步骤得到的重复蛋白质后,筛选得到具有与水稻蛋白质发生潜力互作的稻瘟病菌蛋白质。
S2、收集蛋白质复合体模板空间结构,并将蛋白质复合体拆分成不同亚基,获取亚基对的互作界面;
利用PDB蛋白质结构数据库获取实验测得的蛋白质三维结构数据,所述蛋白质三维结构数据通过核磁共振、X射线晶体衍射或电子显微镜中的至少一种实验方法测定;获取蛋白质三维结构数据后,将蛋白质复合体拆分成不同亚基,利用PIBASE软件读取亚基对的结构数据,提取互作界面信息。
S3、以步骤S2中蛋白质复合体模板空间结构为模板,利用MODPIPE将宿主-病原菌蛋白质序列进行同源结构建模,获得蛋白质同源空间结构模型。
S4、将蛋白质同源空间结构与蛋白质复合体模板空间结构进行比对,获取结构特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011020892.3/2.html,转载请声明来源钻瓜专利网。