[发明专利]基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法有效
申请号: | 202011344614.3 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112447265B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 王会青;颜志良;刘丹;赵虹;赵健;赵静;赵森 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B15/00;G16B5/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 何健雄 |
地址: | 030000 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模块化 密集 卷积 网络 赖氨酸 乙酰化 预测 方法 | ||
1.一种基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法,其特征在于,包括:
S1获取赖氨酸乙酰化位点实验数据并进行预处理,通过编码方式将预处理后的数据转化为数值向量,构建位点初始特征空间;
S2采用模块化密集卷积网络,从位点初始特征空间分别提取蛋白质结构特性、蛋白质原始序列和氨基酸理化属性的高级特征,并通过密集跳跃连接获取低层级特征和高层级特征;
S3引入压缩-激发SE层评估特征的重要性,加权每个特征图,实现蛋白质结构特性、蛋白质原始序列和氨基酸理化属性三类信息的自适应动态融合,得到融合特征;
S4基于融合特征和softmax层构建赖氨酸乙酰化位点预测模型,预测潜在的赖氨酸乙酰化位点;
S5训练基于模块化密集卷积网络的赖氨酸乙酰化位点预测模型;
S6通过十折交叉验证、独立测试、模型泛化能力测试和对未知赖氨酸乙酰化位点的识别能力四种类型实验,评估赖氨酸乙酰化位点预测模型。
2.根据权利要求1所述的基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法,其特征在于,步骤S1中,获取赖氨酸乙酰化位点实验数据并进行预处理包括:
S11从蛋白质赖氨酸修饰数据库获取经实验验证的赖氨酸乙酰化蛋白质序列;
S12利用CD-HIT工具进行序列去冗余,阈值设定为0.4;
S13将过滤后的赖氨酸乙酰化蛋白质序列随机选择10%,构建独立测试数据集,剩余赖氨酸乙酰化蛋白质序列作为训练数据集。
3.根据权利要求2所述的基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法,其特征在于,步骤S1中,通过编码方式将预处理后的数据转化为数值向量,具体包括:
1)使用one-of-21编码位点的蛋白质原始序列信息,得到蛋白质原始序列信息的向量表示;
2)采用Atchley因子编码位点的氨基酸理化属性信息,每个氨基酸残基由5个Atchley因子表示,得到氨基酸理化属性信息的向量表示;
3)通过SPIDER3获取蛋白质结构特性信息,包括3种属性中的8个指数,二级结构:α螺旋P(H)、β链P(C)、γ环P(E);局部骨干扭转角:ψ、θ、τ;可及表面积:ASA;得到蛋白质结构特性信息的向量表示。
4.根据权利要求1所述的基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法,其特征在于,步骤S2具体包括:
1)引入模块化网络结构的设计思想,构建结构、序列和理化三个信息模块;
2)采用堆叠密集卷积块对每个模块进行高级特征的提取,通过密集跳跃连接同时获取低层级特征和高层级特征。
5.根据权利要求4所述的基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法,其特征在于,引入模块化网络结构的设计思想,构建结构、序列和理化三个信息模块,具体包括:
基于蛋白质结构特性、蛋白质原始序列和氨基酸理化属性分别构建了结构模块、序列模块和理化模块和三个特征提取子模块,各子模块间参数空间相互独立。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011344614.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示屏控制方法、装置和电子设备
- 下一篇:一种圆形轨迹施肥装置