[发明专利]一种高效预测革兰氏阴性菌Ⅲ型和Ⅳ型效应蛋白的方法有效
申请号: | 202110811508.X | 申请日: | 2021-07-19 |
公开(公告)号: | CN113539354B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 李重;周天和;李捷 | 申请(专利权)人: | 浙江理工大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G06N3/0464;G06N3/08 |
代理公司: | 杭州敦和专利代理事务所(普通合伙) 33296 | 代理人: | 姜术丹 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高效 预测 革兰氏 阴性 效应 蛋白 方法 | ||
1.一种高效预测革兰氏阴性菌Ⅲ型和Ⅳ型效应蛋白的方法,其特征在于,所述方法为深度神经网络框架(CHR)法,具体包括以下步骤:
(1)搭建集成深度神经网络框架:由CBAM和HS-ResNet两种网络集成得到深度神经网络框架;
(2)数据集的选取:训练集和独立测试集;
(3)使用二维特征和三维特征作为网络的输入特征;
(4)使用步骤(1)搭建的集成深度神经网络框架在数据集上学习预测模型;
(5)模型参数设置;
(6)将待测蛋白质序列输入模型,得到该蛋白质序列的预测结果。
2.根据权利要求1所述一种高效预测革兰氏阴性菌Ⅲ型和Ⅳ型效应蛋白的方法,其特征在于,其特征在于所述数据集包括T3数据集和T4数据集。
3.根据权利要求2所述一种高效预测革兰氏阴性菌Ⅲ型和Ⅳ型效应蛋白的方法,其特征在于,所述T3数据集均是截取的N端100个残基,T4数据集均是截取的N端50个残基和C端100个残基。
4.根据权利要求1或3所述一种高效预测革兰氏阴性菌Ⅲ型和Ⅳ型效应蛋白的方法,其特征在于,所述二维特征包括独热编码(one-hot)、改性位置特异性计分混合矩阵(PsePSSM和PSSM-composition混合矩阵)和改型位置特异性频率的混合矩阵(PsePSFM和PSFM-composition混合矩阵)。
5.根据权利要求4所述一种高效预测革兰氏阴性菌Ⅲ型和Ⅳ型效应蛋白的方法,其特征在于,所述三维特征为精度矩阵。
6.根据权利要求4所述一种高效预测革兰氏阴性菌Ⅲ型和Ⅳ型效应蛋白的方法,其特征在于,所述独热编码(one-hot)、位置特异性计分矩阵(PSSM)和位置特异性频率矩阵(PSFM)是通过HHblits程序在uniprot_sprot database搜索同源序列,然后构建出多序列比对(MSA),最后计算得出。
7.根据权利要求5所述一种高效预测革兰氏阴性菌Ⅲ型和Ⅳ型效应蛋白的方法,其特征在于,所述精度矩阵可以直接协同进化信息。
8.根据权利要求1所述一种高效预测革兰氏阴性菌Ⅲ型和Ⅳ型效应蛋白的方法,其特征在于,所述深度神经网络框架(CHR)是由一系列改进的残差模块组成的,其中每个残差模块主要由1×1的卷积核、CBAM、Hierarchical-Split Block以及全连接层组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110811508.X/1.html,转载请声明来源钻瓜专利网。