[发明专利]基于深度学习的冷冻电镜三维密度图后处理方法和装置有效
申请号: | 202210750372.0 | 申请日: | 2022-06-29 |
公开(公告)号: | CN114841898B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 黄胜友;何佳铧;李涛 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04;G06N3/08;G06T3/40;G06T5/50;G06V10/762;G06K9/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 尹丽媛 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 冷冻 三维 密度 处理 方法 装置 | ||
本发明公开了一种基于深度学习的冷冻电镜三维密度图后处理方法和装置,属于结构生物学检测技术领域,所述方法包括:构建包括多个实验密度图和关联的PDB结构的训练样本集;将每个实验密度图和其对应的模拟密度图进行分割得到多个实验密度块和多个模拟密度块;将各个实验密度图对应的多个实验密度块输入基于UNet++网络模型构建的深度学习网络得到多个预测密度块;利用目标损失函数获取预测密度块与对应的模拟密度块之间的差值,反向传播差值从而训练深度学习网络;将当前冷冻电镜密度图切割为多个当前密度块,将当前密度块输入训练好的深度学习网络,将输出的密度块进行组装得到最终密度图。本发明能够提高冷冻电镜密度图的可解释性。
技术领域
本发明属于结构生物学检测技术领域,更具体地,涉及一种基于深度学习的冷冻电镜三维密度图后处理方法和装置。
背景技术
由于在硬件和图像处理算法方面的不断进步,冷冻电镜(cryo-EM)已成为结构生物学中测定生物大分子结构的标准技术之一。冷冻电镜的最终目标是从密度图中获得大分子复合物的原子模型,在这个过程中,冷冻电镜密度图的质量是至关重要的。然而,由于一些固有的影响,譬如分子运动,密度异质性以及较差的成像,原始的冷冻电镜密度图往往面临高分辨率对比度损失的问题,并不能立即用于准确的结构建模。
传统的密度图锐化方法大致可以分为两类:全局锐化方法和局部锐化方法。全局锐化方法通常在密度图上确定一个B因子,并在整个密度图上应用相同的密度校正。对于大多数电镜图,密度的信噪比在整个图上是不均匀的,而全局锐化方法很容易受到这种异质性的影响,从而产生过度锐化或者欠锐化的区域。与全局锐化方法不同的是,局部锐化方法考虑了冷冻电镜密度图的异质性,在密度图锐化过程中采用与局部密度相关的校正。然而,现有的这些方法都存在一定的不足。局部锐化方法在很大程度上依赖于一些先验信息,例如需要预先提供大分子位置信息,以区分溶剂噪声和结构信号,或者需要对密度图的局部分辨率估计,有些方法甚至需要提供原子模型的结构信息。在实际情形下,这些先验信息往往是难以准确得到的。
为了解决传统锐化方法的局限性,最近提出了基于深度学习的自动冷冻电镜三维密度后处理方法,以提高其可解释性。DeepEMhancer是一种全自动的基于深度学习的方法,它模拟了LocScale算法的局部锐化效果。SuperEM是另一种基于深度学习的方法,它使用三维生成对抗网络(GAN)根据输入的密度图生成分辨率更高的密度图。尽管DeepEMhancer和SuperEM在一些密度图上表现良好,但它们都面临各自的挑战。一方面DeepEMhancer在训练过程中使用原子模型引导的锐化后的密度图作为其训练目标,因此它可能会受到训练集中密度图的准确性或噪声的限制。SuperEM试图最小化从生成网络产生的密度图的和模拟的无噪声的密度图的之间的平均差异,可能会忽略两者之间的结构相关性,从而导致密度对比度的损失。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于深度学习的冷冻电镜三维密度图后处理方法和装置,其目的在于,在深度学习网络的训练过程中,利用无噪声的冷冻电镜图作为模拟密度图,而不是使用原子模型引导的锐化后的密度图,能够避免DeepEMhancer中实验图的噪声和错误问题。此外,通过最小化平滑L1距离和最大化测试密度图和模拟图之间的结构相似性, 使得深度学习网络能够学习到SuperEM中缺失的结构相关性,由此解决现有冷冻电镜三维密度图后处理方法中无法避免噪声和结构缺失的技术问题,能够提高冷冻电镜密度图的可解释性。
为实现上述目的,按照本发明的一个方面,提供了一种基于深度学习的冷冻电镜三维密度图后处理方法,包括以下步骤:
S1:构建包括多个实验密度图和关联的PDB结构的训练样本集;
S2:将每个所述实验密度图和其对应的模拟密度图进行分割,分别得到多个实验密度块和多个模拟密度块;将各个所述实验密度图对应的多个实验密度块输入基于UNet++网络模型构建的深度学习网络得到多个预测密度块;利用目标损失函数获取多个所述预测密度块与对应多个所述模拟密度块之间的差值,反向传播所述差值从而训练所述深度学习网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210750372.0/2.html,转载请声明来源钻瓜专利网。