[发明专利]基于深度学习的冷冻电镜三维密度图后处理方法和装置有效
申请号: | 202210750372.0 | 申请日: | 2022-06-29 |
公开(公告)号: | CN114841898B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 黄胜友;何佳铧;李涛 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04;G06N3/08;G06T3/40;G06T5/50;G06V10/762;G06K9/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 尹丽媛 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 冷冻 三维 密度 处理 方法 装置 | ||
1.一种基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,包括以下步骤:
S1:构建包括多个实验密度图和关联的PDB结构的训练样本集;所述S1包括:S11:从EMDB数据库和PDB数据库下载满足预设分辨率的单粒子冷冻电镜图以及与之关联的PDB结构作为初始样本;S12:对所述单粒子冷冻电镜图及其关联的PDB结构进行筛选和聚类,剔除不满足要求的初始样本;S13:将剩余的所述初始样本中的单粒子冷冻电镜图作为所述实验密度图,将每个所述实验密度图分割成多个预设尺寸的实验密度块;
S2:将每个所述实验密度图和其对应的模拟密度图进行分割,分别得到多个实验密度块和多个模拟密度块;将各个所述实验密度图对应的多个实验密度块输入基于UNet++网络模型构建的深度学习网络得到多个预测密度块;利用目标损失函数获取多个所述预测密度块与对应多个所述模拟密度块之间的差值,反向传播所述差值从而训练所述深度学习网络;
其中,所述模拟密度图为所述实验密度图对应的无噪声的冷冻电镜图;所述目标损失函数为平滑L1损失函数和结构相似性损失函数之和;
S3:将当前冷冻电镜密度图切割为多个当前密度块,将所有的所述当前密度块输入训练好的深度学习网络,将输出的密度块进行组装得到最终密度图。
2.如权利要求1所述的基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,所述S12包括:
S121:若一所述初始样本中的单粒子冷冻电镜图具有非正交的轴或分辨率不满足FSC-0.143黄金标准或与之关联的PDB结构中仅包含骨架原子、包含未知的残基或包含缺失的链,则剔除所述初始样本;
S122:若一所述初始样本中的PDB结构对应的CC_mask值低于预设值,则剔除所述初始样本;
S123:使用贪心算法对剩余的所述初始样本中单粒子冷冻电镜图进行聚类得到多个集合,确定出各个集合中的代表样本,将所述代表样本中的单粒子冷冻电镜图作为所述训练样本。
3.如权利要求2所述的基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,所述S123包括:
若一所述初始样本中PDB结构内的任一条链与另一所述初始样本中PDB结构内任一条链有大于30%的序列相似性,则将两个初始样本放置到一个集合;
将每个所述集合中相似样本数量最多的初始样本作为所述集合的所述代表样本,然后移除该集合中其余初始样本;
将所述代表样本中的单粒子冷冻电镜图作为所述训练样本。
4.如权利要求1所述的基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,所述S2之前,所述方法还包括:
通过三次立方插值将各个所述实验密度图的网格间隔进行统一,负的密度值被截断到零;
采用全局归一化策略将每个所述实验密度图的密度值进行归一化。
5.如权利要求1所述的基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,所述S2包括:
S21:将每个所述实验密度图和其对应的模拟密度图进行分割,分别得到多个实验密度块和多个模拟密度块;
S22:将各个所述实验密度图对应的多个实验密度块输入基于UNet++网络模型构建的深度学习网络得到多个预测密度块;所述UNet++网络模型包括多个编码器模块和多个解码器模块;
S23:利用所述平滑L1损失函数计算预测密度块和模拟密度块之间的密度值的第一差值;利用所述结构相似性损失函数根据预测密度块和模拟密度块的对比度相似性和结构相似性进行比较得到第二差值;将所述第一差值和所述第二差值的和作为所述差值,反向传播所述差值从而训练所述深度学习网络。
6.如权利要求5所述的基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,所述S21包括:
利用预设步长三维滑动窗口将所述实验密度图及其相应的模拟密度图分成多对预设尺寸的密度块,分别记为所述实验密度块和所述模拟密度块;其中,所述模拟密度图是从对应的实验密度图相关联的PDB结构无噪声地模拟得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210750372.0/1.html,转载请声明来源钻瓜专利网。