[发明专利]一种基于序列模板的配体绑定残基预测方法在审
申请号: | 202010928579.3 | 申请日: | 2020-09-07 |
公开(公告)号: | CN112149885A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 胡俊;郑琳琳;白岩松;樊学强;张贵军 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/04;G16B30/00;G16B50/30;G06K9/62 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 序列 模板 绑定 残基 预测 方法 | ||
1.一种基于序列模板的配体绑定残基预测方法,其特征在于,所述预测方法包括以下步骤:
1)输入一个待进行配体绑定残基预测的蛋白质序列P,其残基个数为L;
2)对蛋白质序列P,使用HHblits程序搜索蛋白质序列数据库UniRef90生成一个包含M条蛋白质序列的多序列联配信息,记作MSA;
3)对MSA中的第i条蛋白质序列,其中i=1,2,...,M,通过如下方法提取多个特征信息:
3.1)使用HHblits程序搜索Nr数据库生成一个L行20列的位置特异性评分矩阵,记作PSSM;
3.2)使用SANN程序生成一个L行3列的溶剂可及性特征矩阵,记作SA;
3.3)使用PSIPRED程序生成一个L行3列的蛋白质二级结构特征矩阵,记作PSS;
3.4)使用ANGLOR程序生成一个L行1列的二面角特征矩阵,记作DA;
3.5)对步骤3.1)-3.4)生成的PSSM、SA、PSS、DA特征矩阵按行合并,得到一张L×27的二维特征矩阵;
4)MSA中共有M条蛋白质序列,通过步骤3)一共生成M张L×27的二维特征矩阵,将这M张二维特征矩阵组成一个M×L×27的特征张量;
5)搭建深度卷积神经网络预测蛋白质序列P的绑定残基,该网络共有五层,分别为卷积层、池化层、卷积层、池化层和全连接层,上一层的输出作为下一层的输入,全连接层使用Sigmoid激活函数使输出值在(0,1)范围内,该网络的输出记为:
g(I)=net(pool2(conv2(pool1(conv1(I))))),
I表示网络的输入,conv1、conv2代表第一个和第二个卷积层的运算,pool1,pool2代表第一个和第二个池化层的运算,net代表全连接层的运算;
6)使用已知绑定残基位置的蛋白质序列经过步骤2)-4)生成其对应的特征张量,将特征张量输入到步骤5)所搭建的深度卷积神经网络中,生成对应的预测残基map图,采用交叉熵损失函数来调整网络中的参数,获得能够预测绑定残基位置的深度卷积神经网络模型,交叉熵损失函数记作:
u表示蛋白质序列中待测残基的真实标签,表示网络模型的预测输出值,R表征预测输出与真实标签的差距;
7)将蛋白质序列P生成的特征张量输入到已训练好的深度卷积神经网络模型中,根据训练模型设定输出阈值为value,当输出值大于value时,则蛋白质序列的对应位置残基即为绑定残基,反之则为非绑定残基。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010928579.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理