[发明专利]基于相互作用能项和机器学习的蛋白-配体亲和力预测方法有效
| 申请号: | 201810735055.5 | 申请日: | 2018-07-06 |
| 公开(公告)号: | CN109036580B | 公开(公告)日: | 2021-08-20 |
| 发明(设计)人: | 季长鸽;王卫军;张增辉;闫玉娜;段观福;单金文 | 申请(专利权)人: | 华东师范大学 |
| 主分类号: | G16H70/40 | 分类号: | G16H70/40 |
| 代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
| 地址: | 200241 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 相互作用 机器 学习 蛋白 亲和力 预测 方法 | ||
本发明涉及一种基于相互作用能项和机器学习的蛋白‑配体亲和力预测方法,该方法通过分散配体与蛋白口袋的各种相互作用能项到20种氨基酸残基的主侧链上,并用机器学习的方法对PDB库中已知活性的蛋白‑配体相互作用能信息进行训练得到模型,利用所得模型进行配体与蛋白亲和力打分。本发明通过分散相互作用能项,可以充分考虑不同氨基酸残基主侧链对亲和力的影响;利用机器学习进行非线性拟合,有利于处理各个相互作用能之间的关联或耦合作用,从而针对性的减少不同氨基酸结构在亲和力计算过程中带来的误差。利用本发明,更有利于活性分子亲和力的预测,以达到提高预测准确度的目的。
技术领域
本发明涉及打分函数技术领域,尤其涉及一种基于配体与蛋白结合口袋残基相互作用能和机器学习的蛋白质-配体亲和力预测方法。
背景技术
在药物设计过程中,打分函数通常用于蛋白质靶标与其配体之间的结合亲和力的预测,从而提高药物设计的成功率和降低药物筛选的成本。近年来,越来越受到相关科研机构和制药公司的重视。常用的打分函数方法可以分为基于力场的打分函数,基于经验的打分函数和基于知识的打分函数。常用打分函数有PLP,ChemScore,X-Score,和GlideScore等。其中,基于经验的打分函数应用最为广泛。基于经验的打分函数通常是由蛋白质和配体多种物理化学相互作用项组成,如范德华、氢键、静电以及金属-配体相互作用能等。这些项往往通过线性拟合得到相关系数。然而,目前基于经验的打分函数仍然存在如预测值与实验值相关性不佳、靶点依赖性大和对同系物敏感性差等相关问题。而导致这些问题的原因很多,比如相互作用能项过少导致差异化一定程度被忽略,蛋白配体复合物数据集很少导致多样性不够,线性回归忽略了各相互作用能项间的耦合作用。
机器学习已经被广泛的应用于药物设计的各个领域,包括靶标预测、毒性预测、药物相似性预测、药物活性预测等。常用的机器学习方法包括支持向量机、随机森林和人工神经网络等。
因此,利用机器学习发展新的预测蛋白-配体亲和力的打分函数新方法,在基于结构的药物设计和药物创新发展中有着至关重要的作用。
发明内容
本发明的目的在于提供一种基于氨基酸残基相互作用能项和机器学习的蛋白-配体亲和力预测方法,以弥补现有技术的不足。
实现本发明目的的具体技术方案是:
一种基于相互作用能项和机器学习的蛋白-配体亲和力预测方法,该方法包括以下具体步骤:
步骤1:从PDBbind数据库或RCSB-PDB数据库中得到含配体小分子的蛋白配体复合物结晶体结构,并从PDBbind数据库或文献中得到并提取亲和力的活性数据;其中,所述含配体小分子的蛋白配体复合物结晶体结构为:要求配体的亲和力类型为Kd或Ki,且所有复合物配体亲和力值于皮摩尔级、纳摩尔级、微摩尔级和毫摩尔级均有超过100个的分布;
步骤2:通过PDBFixer软件对所有蛋白进行预处理,其包括补齐缺失氨基酸残基,补齐缺失原子,加氢;
步骤3:基于amber99SB力场获取蛋白原子电荷;
步骤4:计算找出每个蛋白配体小分子结合口袋附近的氨基酸残基,具体为:选定蛋白靶标 PDB晶体结构自身配体周围范围内的残基作为蛋白结合口袋中的氨基酸残基;
步骤5:计算每个配体小分子的每个原子与蛋白结合口袋中的氨基酸残基每个原子的相互作用能,具体为:计算每个配体小分子的每个原子与氨基酸残基每个原子的范德华、氢键、疏水、静电的相互作用能和金属-配体相互作用能,以及配体自身的可旋转键数量;其具体定义如下:
1范德华相互作用能为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810735055.5/2.html,转载请声明来源钻瓜专利网。





