[发明专利]基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法有效
申请号: | 202011344614.3 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112447265B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 王会青;颜志良;刘丹;赵虹;赵健;赵静;赵森 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B15/00;G16B5/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 何健雄 |
地址: | 030000 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模块化 密集 卷积 网络 赖氨酸 乙酰化 预测 方法 | ||
本发明公开了一种基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法,引入蛋白质结构特性,将其与蛋白质原始序列、氨基酸理化属性相结合来构建位点特征空间;采用模块化密集卷积网络捕获不同层级的特征信息,在特征学习过程中减少信息丢失和信息串扰;并引入压缩‑激发层来评估不同特征的重要性,提高网络的抽象能力,以识别潜在的赖氨酸乙酰化位点。本发明能够有效地解决现有方法仅考虑蛋白质序列层面信息和特征学习效率低下的问题,更准确的预测了潜在的赖氨酸乙酰化位点,降低赖氨酸乙酰化位点的验证成本,提高了赖氨酸乙酰化修饰的研究效率。
技术领域
本发明涉及赖氨酸乙酰化位点预测研究与分析领域,尤其涉及一种基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法。
背景技术
赖氨酸乙酰化是一种保守的蛋白质翻译后修饰,与多种代谢疾病密切相关,因此,赖氨酸乙酰化位点的识别对于代谢疾病治疗的研究具有重要意义。蛋白质结构特性包含高度有用的结构信息,为蛋白质翻译后修饰的鉴定提供了有力的依据;特征学习过程中,不同层级特征间的信息存在互补,同时关注不同层级特征的信息能够有效提高特征质量。现有的深度学习方法采用蛋白质序列层面的信息作为输入,未考虑到蛋白质结构特性;特征提取时仅考虑了高层级特征,导致信息严重丢失,进而降低预测结果。
发明内容
本发明的目的在于避免现有技术的不足之处而提供一种基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法。
本发明的目的可以采用如下的技术措施来实现,设计一种基于模块化密集卷积网络的赖氨酸乙酰化位点预测方法,包括:
从蛋白质结构特性、蛋白质原始序列和氨基酸理化属性信息三个方面描述赖氨酸乙酰化位点,构建位点初始特征空间;
采用模块化密集卷积网络,从位点的初始特征空间分别提取蛋白质结构特性、蛋白质原始序列和氨基酸理化属性的高级特征,通过密集跳跃连接同时关注低层级特征和高层级特征;
引入压缩-激发(SE)层评估特征的重要性,加权每个特征图,实现三类信息的自适应动态融合;
基于融合特征和softmax层构建赖氨酸乙酰化位点分类器,预测潜在的赖氨酸乙酰化位点;
训练基于模块化密集卷积网络的赖氨酸乙酰化位点预测模型;
通过十折交叉验证、独立测试、模型泛化能力测试和对未知赖氨酸乙酰化位点的识别能力四种类型的实验来评估提出的模型。
其中,从蛋白质结构特性、蛋白质原始序列和氨基酸理化属性信息三个方面描述赖氨酸乙酰化位点,构建位点初始特征空间的步骤包括:
(1)赖氨酸乙酰化位点的实验数据收集和预处理;
(2)通过编码方式将收集到的蛋白质数据转化为数值向量,构建位点初始特征空间,并作为预测模型的输入。
其中,赖氨酸乙酰化位点的实验数据收集和预处理,包括步骤:
从蛋白质赖氨酸修饰数据库(PLMD)收集并下载了6078条、3645条和1860条经实验验证的人类、小家鼠和大肠杆菌赖氨酸乙酰化蛋白质数据。
考虑到SPIDER3服务器无法处理含有非标准氨基酸的蛋白质序列,本发明手动删除了这些蛋白质序列。以人类这一物种为例,利用CD-HIT工具进行序列去冗余避免序列同源性较大而造成模型的偏差,阈值设定为0.4,保留了4977条乙酰化蛋白质序列。本发明将过滤后的4977条乙酰化蛋白质序列随机选择10%(498条)构建独立测试数据集,剩余乙酰化蛋白质序列作为训练数据集,便于与其他赖氨酸乙酰化位点预测器进行比较。
其中,通过编码方式将收集到的蛋白质数据转化为数值向量,构建位点初始特征空间,并作为预测模型的输入,包括步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011344614.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示屏控制方法、装置和电子设备
- 下一篇:一种圆形轨迹施肥装置