[发明专利]一种基于结构特征的DNA绑定残基预测方法在审
申请号: | 202110081107.3 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112837740A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 胡俊;白岩松;董世建;郑琳琳;樊学强;张贵军 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/00;G06N3/04;G06N3/08 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 特征 dna 绑定 残基 预测 方法 | ||
一种基于结构特征的DNA绑定残基预测方法,首先,根据输入的待进行DNA绑定残基预测的蛋白质结构信息,以任一残基为球心,R为半径,通过以下四步获取该残基的特征向量:1)统计该球内20种常见类型残基出现的频率,记作2)统计该球内三类二级结构类别的残基出现的频率,记作3)统计该球内三类溶剂可及性类别的残基出现的频率,记作4)将步骤1)至3)中的串联成一个特征向量;然后,构建样本集并训练所搭建的一维卷积神经网络;最后,将蛋白质结构中残基的特征向量输入训练的模型中,根据模型输出概率是否大于阈值threshold,进而判断对应残基是否为DNA绑定残基。本发明计算代价小、预测精度高。
技术领域
本发明涉及生物信息学、模式识别与计算机应用领域,具体而言涉及一种基于结构特征的DNA绑定残基预测方法。
背景技术
蛋白质与配体相互作用在生命过程中是普遍存在且不可或缺的,这种相互作用在生物分子的识别和信号传递过程中起着非常重要的作用。DNA分子是重要的一类配体分子,准确识别蛋白质序列中DNA分子的绑定残基,有助于理解蛋白质功能、分析蛋白质与DNA分子之间的相互作用机制及设计药物靶蛋白,具有重要的生物学意义。
调研文献发现,许多用于预测蛋白质序列中DNA绑定残基的方法已被提出,如:DNAPred(Zhu Y,Hu J,Song X,et al.DNAPred:Accurate Identification of DNA-Binding Sites from Protein Sequence by Ensembled Hyperplane-Distance-BasedSupport Vector Machines[J].Journal of Chemical Information and Modeling,2019,59(6):3057-3071.即:Zhu Y等.集成基于超平面距离的支持向量机来准确识别蛋白质序列中的DNA绑定位点[J].化学信息和建模期刊,2019,59(6):3057-3071)、EL_PSSM-RT(ZhouJ,Lu Q,Xu R,et al.EL_PSSM-RT:DNA-binding residue prediction by integratingensemble learning with PSSM Relation Transformation[J].BMC Bioinformatics,2017,18(1):1-16.即:Zhou J等.通过结合集成学习与PSSM关系转化预测DNA绑定残基[J].生物信息学,2017,18(1):1-16)、CNNsite(Zhou J,Lu Q,Xu R,et al.CNNsite:predictionof DNA-binding residues in proteins using convolutional neural network withsequence features[J],2016:78-85.即:Zhou J等.基于序列特征的卷积神经网络预测蛋白质DNA绑定残基[J],2016:78-85)、DP-Bind(Hwang S,Gou Z,Kuznetsov A I B.DP-Bind:a web server for sequence-based prediction of DNA-binding residues in DNA-binding proteins.[J].Bioinformatics,2007,23(5):634-636.即:Hwang S等.一个基于序列的蛋白质DNA绑定残基预测服务器[J].生物信息学,2017,23(5):634-636)等。尽管已有方法可以用于预测蛋白质序列中的DNA绑定残基,但是蛋白质的三维结构信息没有得到足够的关注,预测精度并不能保证是最优的,有待进一步提升。
综上所述,已有的DNA绑定残基的预测方法在计算代价、预测精度两个方面距离实际应用的要求还有很大差距,迫切地需要改进。
发明内容
为了克服已有的DNA绑定残基预测方法在计算代价、预测精度两个方面的不足,本发明提出一种计算代价小、预测精度高的基于结构特征的DNA绑定残基预测方法。
本发明解决其技术问题所采用的技术方案是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110081107.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多级循环载荷作用下材料疲劳寿命预测方法
- 下一篇:一种地热能分布式供能系统