[发明专利]基于相互作用能项和机器学习的蛋白-配体亲和力预测方法有效
| 申请号: | 201810735055.5 | 申请日: | 2018-07-06 |
| 公开(公告)号: | CN109036580B | 公开(公告)日: | 2021-08-20 |
| 发明(设计)人: | 季长鸽;王卫军;张增辉;闫玉娜;段观福;单金文 | 申请(专利权)人: | 华东师范大学 |
| 主分类号: | G16H70/40 | 分类号: | G16H70/40 |
| 代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
| 地址: | 200241 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及一种基于相互作用能项和机器学习的蛋白‑配体亲和力预测方法,该方法通过分散配体与蛋白口袋的各种相互作用能项到20种氨基酸残基的主侧链上,并用机器学习的方法对PDB库中已知活性的蛋白‑配体相互作用能信息进行训练得到模型,利用所得模型进行配体与蛋白亲和力打分。本发明通过分散相互作用能项,可以充分考虑不同氨基酸残基主侧链对亲和力的影响;利用机器学习进行非线性拟合,有利于处理各个相互作用能之间的关联或耦合作用,从而针对性的减少不同氨基酸结构在亲和力计算过程中带来的误差。利用本发明,更有利于活性分子亲和力的预测,以达到提高预测准确度的目的。 | ||
| 搜索关键词: | 基于 相互作用 机器 学习 蛋白 亲和力 预测 方法 | ||
【主权项】:
1.一种基于相互作用能项和机器学习的蛋白‑配体亲和力预测方法,其特征在于,该方法包括以下具体步骤:步骤1:从PDBbind数据库或RCSB‑PDB数据库中得到含配体小分子的蛋白配体复合物结晶体结构,并从PDBbind数据库或文献中得到并提取亲和力的活性数据;步骤2:通过PDBFixer软件对所有蛋白进行预处理;步骤3:基于amber99SB力场获取蛋白原子电荷;步骤4:计算找出每个蛋白配体小分子结合口袋附近的氨基酸残基;步骤5:计算每个配体小分子的每个原子与蛋白结合口袋中的氨基酸残基每个原子的相互作用能;步骤6:根据不同氨基酸残基的主侧链形成相互作用能矩阵;步骤7:调用随机森林的非线性回归方法;步骤8:设置参数并训练得到打分函数模型;步骤9:由独立的测试集进行验证;步骤10:利用打分函数模型进行亲和力预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810735055.5/,转载请声明来源钻瓜专利网。





