[发明专利]以给定蛋白质主链结构为目标的氨基酸序列设计方法在审
申请号: | 202210091553.7 | 申请日: | 2022-01-26 |
公开(公告)号: | CN114429783A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 刘海燕;陈泉;李厚强;刘宇枫;王炜伦 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B15/00;G16B40/00 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 乔献丽 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 给定 蛋白质 链结 目标 氨基酸 序列 设计 方法 | ||
本发明提供以给定蛋白质主链结构为目标的氨基酸序列设计方法。本发明的方法只使用环境残基的侧链类型作为编码器的输入,序列设计过程中只需要更新侧链类型,不需要重构和优化侧链构象,显著降低了序列设计问题的复杂度,因而可以简单的用迭代的方法来优化全序列。所获得的序列折叠成目标结构的成功率高,结构稳定性高。
技术领域
本发明属于蛋白质设计领域,具体涉及以给定蛋白质主链结构为目标的氨基酸序列设计方法,即根据预设的目标主链结构,自动设计蛋白质的全部或部分氨基酸序列。该方法使用预训练的深度学习神经网络编码器,将单个中心残基所处的三维局部结构环境编码为一个实值向量,同时预训练编码器-解码器,使用解码器将该向量解码为中心残基的侧链类型。该编码器的输入包含了与中心残基空间相邻的其他残基的侧链类型信息。在序列设计中,我们从任意设置的初始序列出发,将该编码器/解码器应用于不同的中心残基,根据对中心残基在当前序列背景下的局部环境解码输出更新中心残基的侧链类型;该过程反复迭代,最终产生氨基酸序列,作为设计结果。
背景技术
背景技术1:给定主链结构自动设计氨基酸序列。
该技术以使用者给定的蛋白质主链结构为目标,自动选择氨基酸序列,使得具有该氨基酸序列的分子能自发稳定地折叠成目标三维蛋白质构象。最早报道成功自动设计氨基酸序列的文献为Dahiyat等,Science 278,82-87(1997)。该工作和后来由美国华盛顿大学Baker和合作者开发的RosettaDesign(Kuhlman等,Science 302,1364-1368(2003))是通过优化主要基于物理模型的能量函数实现序列设计。此外,基于统计能量函数的ABACUS方法(Xiong等,Nature Communications 5,5330(2014)以及Xiong等,Bioinformatics 36,136-144(2020))也被成功应用于给定主链自动设计氨基酸序列。上述方法已被应用于蛋白质设计及工程中。大量实验结果已经证实上述方法可以设计出自发折叠成类似目标三维结构的氨基酸序列。但上述方法仍然存在实验验证成功率不高、解析出设计蛋白质结构和模板差异较大等缺点。
背景技术2:应用深度学习模型设计氨基酸序列。
对于利用深度学习模型从头设计可自发折叠的氨基酸序列,目前已经报道的方法主要有两类,分别使用a.三维卷积神经网络(Anand等,Biorxiv,2021:2020.01.06.895466)、b.自回归模型生成氨基酸序列(Ingraham等,Advances in NeuralInformation Processing Systems,2019,32:15820-15831)。
应用三维卷积神经网络的模型主要通过映射原子类型和原子坐标到体素格中以实现侧链类型及构象的重新设计,其主要受限于其设计过程高度依赖无法在设计过程中获得的精确的原子坐标信息,且全原子的序列设计过程自由度较高难以优化。自回归模型虽然已在天然序列恢复率等指标上取得了较大提升,但在设计较长序列时自回归过程的上游不合理设计效应会被聚集并传播到下游过程,因此可能难以在实验中验证。
因此,依然需要能够根据预设的目标主链结构,自动设计蛋白质的全部或部分氨基酸序列的方法。
发明内容
为解决现有技术中存在的技术问题,本发明提供以下技术方案:
一方面,本发明提供以给定蛋白质主链结构为目标的氨基酸序列设计方法,其特征在于,所述方法包括:
a.用深度学习神经网络编码器将单个中心氨基酸残基的局部环境编码为一实值向量;
b.用神经网络解码器对所述实值向量进行解码获得中心残基的侧链类型;
c.用已知蛋白质序列结构数据对编码器-解码器进行预训练,训练的目标为恢复中心残基的天然侧链类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210091553.7/2.html,转载请声明来源钻瓜专利网。