[发明专利]抗体互补决定区构象指纹数据库在审
申请号: | 201710475559.3 | 申请日: | 2017-06-21 |
公开(公告)号: | CN107463793A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 杨家安 | 申请(专利权)人: | 南京迈格罗医药科技有限公司 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙)42242 | 代理人: | 常海涛 |
地址: | 210038 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抗体 互补 决定 构象 指纹 数据库 | ||
1.一种抗体互补决定区构象指纹数据库,对于每个抗体蛋白,包括名称,氨基酸序列,互补决定区片段范围,全信息构象指纹共四组数据,所述的氨基酸序列和互补决定区片段范围,从蛋白知识数据库获得,所述的全信息构象指纹,分两种情况处理:
对于已知三维结构的抗体蛋白,从蛋白数据库里获得全部结构数据,并用蛋白折叠形状码表示,再将抗体互补决定区的折叠形状码提取出来,作为该抗体互补决定区的全信息构象指纹;
对于未知结构的抗体蛋白,该抗体互补决定区的全信息构象指纹是对抗体互补决定区的三维空间构象进行预测得到的构象谱带;
对于未知结构的抗体互补决定区预测得到的构象谱带,通过如下过程获得:
1)从全部20个氨基酸中任意地提取5个氨基酸,形成总数为3,200,000的不同排列,每一个排列的可能折叠构象从全球蛋白质数据库获得,然后用蛋白折叠形状码表示;创建了一个数据库来收集上述排列及其对应的蛋白折叠形状码,该数据库被命名为5AAPFSC;
2)对于抗体互补决定区的蛋白质,沿着氨基酸序列,从N-端开始,逐步移动向C-端,依次读取每5个连续的氨基酸,其可能具有的折叠构象从5AAPFSC数据库直接获得,用蛋白折叠形状码的字符表示;在蛋白质数据库中出现频率最高的折叠构象对应的蛋白折叠形状码排在第一位,出现频率第二高的折叠形状码排在第二位,从上到下依次形成一列,直至收集完全为止,每5个连续的氨基酸具有不同数目的折叠构象可能;
3)抗原互补决定区的全部可能的折叠形状码形成一个阵列,称为蛋白折叠构象谱带,代表了互补决定区全部可能的折叠构象;对于每一个位点,通过其全部可能的折叠形状码的相互替代,可以准确地得到所有可能的构象;可能构象的总数目是全部每5个氨基酸可能折叠构象数目的连续乘积。
2.根据权利要求1所述的抗体互补决定区构象指纹数据库,其特征在于,对于未知结构的抗体互补决定区预测得到的构象谱带的一个空间构象是由每个位点出现频率最高的折叠构形状码共同构成。
3.根据权利要求1所述的抗体互补决定区构象指纹数据库,其特征在于,对于未知结构的抗体互补决定区预测得到的构象谱带的一个空间构象是由每个位点出现频率第二高的折叠形状码构成,在没有第二高频率构象的位置,以频率最高的折叠形状码作为补充构成。
4.根据权利要求1所述的抗体互补决定区构象指纹数据库,其特征在于,对于未知结构的抗体互补决定区预测得到的构象谱带的一个空间构象是由每个位点出现频率第三高的折叠形状码组成,在没有第三高频率构象的位置,以频率最高的折叠形状码作为补充构成。
5.根据权利要求1所述的抗体互补决定区构象指纹数据库,其特征在于,所述蛋白质折叠形状码,对应27个描述五个连续氨基酸残基的折叠形状的向量;所述向量通过以下方法构建:
A)取蛋白质中每五个连续的氨基酸作为一个基本单元;
B)计算每个基本单元中的第一个二面角,该二面角是第一,第二,第三个氨基酸决定的平面与第二、第三、第四个氨基酸决定的平面的夹角;该二面角为a1,a2,a3所确定的范围之一;
C)计算每个基本单元中的第二个二面角,该二面角是第二、第三、第四个氨基酸决定的平面与第三、第四、第五个氨基酸决定的平面的夹角,该二面角为b1,b2,b3所确定的范围之一;
D)计算每个基本单元中的第一与第五个氨基酸之间的伸张距离,所述伸张距离为c1,c2,c3所确定的范围之一;
E)依据步骤B,C,D得到的数值确定每个基本单元的向量;
所述a1从0°~130°,a2从130°~-130°,a3从-130°~0°;b1从0°~130°,b2从130°~-130°,b3从-130°~0°;c1从0~7.0埃,c2从4.0~17埃,c3大于12埃。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京迈格罗医药科技有限公司,未经南京迈格罗医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710475559.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:洗手盆(78125)
- 下一篇:润滑油桶(2)
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用