[发明专利]抗体互补决定区构象指纹数据库在审
申请号: | 201710475559.3 | 申请日: | 2017-06-21 |
公开(公告)号: | CN107463793A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 杨家安 | 申请(专利权)人: | 南京迈格罗医药科技有限公司 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙)42242 | 代理人: | 常海涛 |
地址: | 210038 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抗体 互补 决定 构象 指纹 数据库 | ||
技术领域
本发明涉及抗体互补决定区构象指纹数据库,属于生物信息学领域。
背景技术
抗体又称免疫球蛋白,是免疫系统用来识别并且抵抗外来入侵的细菌或者病毒等的大型Y形蛋白质。抗体可以按照物理化学,生物功能或者来源分类。单克隆抗体的发展经历了四个阶段,分别为:鼠源性单克隆抗体、嵌合性单克隆抗体、人源化单克隆抗体和全人源单克隆抗体。
抗体是具有4条多肽链的对称结构,其中2条较长的重链(H链);2条较短的轻链(L链)。整个抗体分子可分为恒定区和可变区两部分。可变区位于"Y"的两臂末端。在可变区内有一小部分氨基酸残基变化特别强烈,这些氨基酸的残基组成和排列顺序更易发生变异区域称高变区。高变区位于分子表面,该部位因在空间结构上可与抗原决定簇形成精密的互补,故高变区又称互补决定区。高变区氨基酸序列和构象决定了抗体对抗原的特异性识别和结合作用。抗体的主要功能是通过抗体互补决定区识别抗原与抗原相结合,从而有效地清除侵入机体内的微生物、寄生虫等异物,因此,抗体互补决定区的研究对抗体研究至关重要。
迄今未知,全球蛋白知识数据库(UniProt)中有大约550种抗体蛋白的三维结构被测定,另外有2万5千抗体蛋白仅仅知道一级序列。基于发明人开发的蛋白质结构指纹技术(Protein Structure Fingerprint,PSFT),采用蛋白结构指纹方法表征已知结构的抗体蛋白,同时预测未知结构的抗体蛋白。然后,在此基础上,建立抗体互补决定区指纹数据库。
发明内容
本发明所要解决的技术问题是提供一种抗体互补决定区构象指纹数据库。
本发明的抗体互补决定区构象指纹数据库,对于每个抗体蛋白,包括名称,氨基酸序列,互补决定区片段范围,全信息构象指纹共四组数据,所述的氨基酸序列和互补决定区片段范围,从蛋白知识数据库(UniProt)获得,所述的全信息构象指纹,分两种情况处理:
对于已知三维结构的抗体蛋白,从蛋白数据库里获得全部结构数据,并用蛋白折叠形状码表示,再将抗体互补决定区的折叠形状码提取出来,作为该抗体互补决定区的全信息构象指纹;
对于未知结构的抗体蛋白,该抗体互补决定区的全信息构象指纹是对抗体互补决定区的三维空间构象进行预测得到的构象谱带。
从数学角度来看氨基酸,通过不同的排序,5个氨基酸可以形成不同的排列。从全部20个氨基酸中任意地提取5个氨基酸将可以形成总数为3,200,000的不同排列。每一个排列的可能折叠构象可以从全球蛋白质数据库(PDB)获得,然后用蛋白折叠形状码(PFSC)表示。在此基础上,我们创建了一个数据库来收集上述三百二十万个排列的折叠构象。该全新的数据库被命名为5AAPFSC。
本发明的数据库中,对于未知结构的抗体互补决定区预测得到的构象谱带,通过如下过程获得:
1)从全部20个氨基酸中任意地提取5个氨基酸,形成总数为3,200,000的不同排列,每一个排列的可能折叠构象从全球蛋白质数据库(PDB)获得,然后用蛋白折叠形状码表示;创建了一个数据库来收集上述排列及其对应的蛋白折叠形状码,该数据库被命名为5AAPFSC;
2)对于抗体互补决定区的蛋白质,沿着氨基酸序列,从N-端开始,逐步移动向C-端,依次读取每5个连续的氨基酸,其可能具有的折叠构象从5AAPFSC数据库直接获得,用蛋白折叠形状码的字符表示;在蛋白质数据库(PDB)中出现频率最高的折叠构象对应的蛋白折叠形状码排在第一位,出现频率第二高的折叠形状码排在第二位,从上到下依次形成一列,直至收集完全为止,每5个连续的氨基酸具有不同数目的折叠构象可能;
3)抗原互补决定区的全部可能的折叠形状码形成一个阵列,称为蛋白折叠构象谱带,代表了互补决定区全部可能的折叠构象;对于每一个位点,通过其全部可能的折叠形状码的相互替代,可以准确地得到所有可能的构象;可能构象的总数目是全部每5个氨基酸可能折叠构象数目的连续乘积。
对于任何一个抗体互补决定区,尽管全部可能的空间构象的数目是巨大的,但可能性高的空间构象通过出现频率高的局域折叠构象组合获得。举例来说,可能性高的第一个空间构象是由每个位点出现频率最高的折叠构形状码共同构成;第二个空间构象是由每个位点出现频率第二高的折叠形状码构成,在没有第二高频率构象的位置,以频率最高的的折叠形状码作为补充构成;第三个空间构象是由每个位点出现频率第三高的折叠形状码组成,在没有第三高频率构象的位置,以频率最高的的折叠形状码作为补充构成;如此类推,形成可能性较高的一系列可能的预测构象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京迈格罗医药科技有限公司,未经南京迈格罗医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710475559.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:洗手盆(78125)
- 下一篇:润滑油桶(2)
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用