[发明专利]一种植物与病原菌蛋白质相互作用的预测方法在审
申请号: | 202011020892.3 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112185459A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 张利达;郑存俭;刘源;孙方楠 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G16B15/30 | 分类号: | G16B15/30;G16B15/20;G16B50/30 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 叶敏华 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 植物 病原菌 蛋白质 相互作用 预测 方法 | ||
1.一种植物与病原菌蛋白质相互作用的预测方法,其特征在于,包括下列步骤:
1)收集宿主-病原菌蛋白质互作阳性数据;
2)收集蛋白质复合体模板空间结构,并将蛋白质复合体拆分成不同亚基,获取亚基对的互作界面;
3)以步骤2)中蛋白质复合体模板空间结构为模板,将宿主-病原菌蛋白质序列进行同源结构建模,获取蛋白质同源空间结构模型;
4)将蛋白质同源空间结构与蛋白质复合体模板空间结构进行比对,获取结构特征;
5)收集模式生物的蛋白质相互作用数据,获取模式生物阳性互作数据集,并提取非结构特征;
6)基于结构特征和非结构特征,搭建机器学习模型并测试调整,对基因组尺度的水稻-稻瘟病菌蛋白质互作进行预测。
2.根据权利要求1所述的植物与病原菌蛋白质相互作用的预测方法,其特征在于,步骤1)中,利用HPIDB数据库收集宿主-病原菌蛋白质互作阳性数据,所述宿主-病原菌蛋白质互作阳性数据满足通过酵母双杂交等蛋白质互作检测手段中至少一种实验方法测定获得。
3.根据权利要求1所述的植物与病原菌蛋白质相互作用的预测方法,其特征在于,步骤2)的具体内容为:
利用PDB蛋白质结构数据库获取实验测得的蛋白质三维结构数据,所述蛋白质三维结构数据通过核磁共振、X射线晶体衍射或电子显微镜中的至少一种实验方法测定;获取蛋白质三维结构数据后,将蛋白质复合体拆分成不同亚基,利用PIBASE软件读取亚基对的结构数据,提取互作界面信息。
4.根据权利要求3所述的植物与病原菌蛋白质相互作用的预测方法,其特征在于,步骤3)中,以步骤2)中实验测得的蛋白质三维结构数据为模板,利用MODPIPE将宿主-病原菌蛋白质序列进行同源结构建模,获得蛋白质同源空间结构模型。
5.根据权利要求1所述的植物与病原菌蛋白质相互作用的预测方法,其特征在于,步骤4)中,利用TM-align软件将蛋白质同源空间结构与蛋白质复合体模板空间结构进行比对,获取结构特征。
6.根据权利要求5所述的植物与病原菌蛋白质相互作用的预测方法,其特征在于,所述结构特征包括蛋白质同源空间结构与蛋白质复合体的相似度、结构偏差度以及蛋白质同源空间结构与蛋白质复合体模板空间结构的互作界面的保守残基数目、保守残基占比。
7.根据权利要求1所述的植物与病原菌蛋白质相互作用的预测方法,其特征在于,步骤5)中,利用同源映射分析植物-病原菌蛋白质互作的跨物种保守性,获取蛋白质同源映射关系,结合结构域互作数据集,获取有互作结构域支撑的相关互作蛋白质对,即结构域相互作用关系。
8.根据权利要求1所述的植物与病原菌蛋白质相互作用的预测方法,其特征在于,步骤6)的具体内容为:
对步骤1)得到的宿主-病原菌蛋白质互作阳性数据集进行序列聚类、随机组合生成一定量的阴性数据集,将阳性数据集与阴性数据集按一定比例生成训练集和测试集,根据训练集的结构特征和非结构特征,利用scikit-learn随机森林搭建机器学习模型,并使用网格搜索功能对机器学习模型进行调参优化,对基因组尺度的水稻-稻瘟病菌蛋白质对相互作用进行预测,并采用Cytoscape软件绘制水稻-稻瘟病菌蛋白质互作网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011020892.3/1.html,转载请声明来源钻瓜专利网。