[发明专利]基于相互作用能项和机器学习的蛋白-配体亲和力预测方法有效
| 申请号: | 201810735055.5 | 申请日: | 2018-07-06 |
| 公开(公告)号: | CN109036580B | 公开(公告)日: | 2021-08-20 |
| 发明(设计)人: | 季长鸽;王卫军;张增辉;闫玉娜;段观福;单金文 | 申请(专利权)人: | 华东师范大学 |
| 主分类号: | G16H70/40 | 分类号: | G16H70/40 |
| 代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
| 地址: | 200241 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 相互作用 机器 学习 蛋白 亲和力 预测 方法 | ||
1.一种基于相互作用能项和机器学习的蛋白-配体亲和力预测方法,其特征在于,该方法包括以下具体步骤:
步骤1:从PDBbind数据库或RCSB-PDB数据库中得到含配体小分子的蛋白配体复合物结晶体结构,并从PDBbind数据库或文献中得到并提取亲和力的活性数据;
步骤2:通过PDBFixer软件对所有蛋白进行预处理;
步骤3:基于amber99SB力场获取蛋白原子电荷;
步骤4:计算找出每个蛋白配体小分子结合口袋附近的氨基酸残基;
步骤5:计算每个配体小分子的每个原子与蛋白结合口袋中的氨基酸残基每个原子的相互作用能;
步骤6:根据不同氨基酸残基的主侧链形成相互作用能矩阵;
步骤7:调用随机森林的非线性回归方法;
步骤8:设置参数并训练得到打分函数模型;
步骤9:由独立的测试集进行验证;
步骤10:利用打分函数模型进行亲和力预测;其中:
所述根据不同氨基酸残基的主侧链形成相互作用能矩阵,具体包括:
1将与结合口袋中所有氨基酸的主链原子相关的相互作用能按范德华相互作用能,氢键相互作用能,疏水相互作用能,正的静电相互作用能,负的静电相互作用能合并为5项;
2将与结合口袋中所有氨基酸的侧链原子相关的相互作用能按人体20种不同氨基酸类型分别以范德华相互作用能,氢键相互作用能,疏水相互作用能,正的静电相互作用能,负的静电相互作用能共合并为100项;
3配体小分子原子与金属的金属-配体相互作用能合并为1项;
4配体小分子的可旋转键数量为1项;
共107项相互作用能形成相互作用能矩阵;
所述利用打分函数模型进行亲和力预测,具体包括:
1输入靶点复合物中蛋白和小分子三维结构数据;
2对蛋白结构进行预处理;
3获取蛋白活性中心口袋;
4生成107项相互作用能;
5调用打分函数模型并输出给定复合物亲和力预测值。
2.根据权利要求1所述一种基于相互作用能项和机器学习的蛋白-配体亲和力预测方法,其特征在于,步骤1中,所述含配体小分子的蛋白配体复合物结晶体结构为:要求蛋白-配体的亲和力类型为Kd或Ki,且所有复合物配体亲和力值于皮摩尔级、纳摩尔级、微摩尔级和毫摩尔级均有超过100个的分布。
3.根据权利要求1所述一种基于相互作用能项和机器学习的蛋白-配体亲和力预测方法,其特征在于,步骤2中,所述通过PDBFixer软件对所有蛋白进行预处理包括补齐缺失氨基酸残基,补齐缺失原子,加氢。
4.根据权利要求1所述一种基于相互作用能项和机器学习的蛋白-配体亲和力预测方法,其特征在于,步骤4中,所述计算找出每个蛋白配体小分子结合口袋附近的氨基酸残基为:选定蛋白靶标PDB晶体结构自身配体周围范围内的残基作为蛋白结合口袋中的氨基酸残基。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810735055.5/1.html,转载请声明来源钻瓜专利网。





