[发明专利]晶体衍射图像筛选模型训练方法和晶体衍射图像筛选方法在审

专利信息
申请号: 202210354459.6 申请日: 2022-04-06
公开(公告)号: CN114842290A 公开(公告)日: 2022-08-02
发明(设计)人: 许康;祝永新;郑小盈 申请(专利权)人: 中国科学院上海高等研究院
主分类号: G06V10/774 分类号: G06V10/774;G06T7/66;G06T7/50;G06T7/11
代理公司: 上海光华专利事务所(普通合伙) 31219 代理人: 刘逸潇
地址: 201210 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 晶体 衍射 图像 筛选 模型 训练 方法
【说明书】:

发明公开了一种晶体衍射图像筛选模型训练方法和晶体衍射图像筛选方法,其中训练方法包括:每个训练小组分别基于本地训练数据进行模型训练,并将训练的模型参数发送给中央服务器,中央服务器基于预设聚合方式对所有所述模型参数进行聚合以获取全局梯度参数组,并基于全局梯度参数组更新衍射图像筛选全局模型,每个训练小组分别判断其是否满足完成识别率不再降低要求,并将判断结果发送给中央服务器,中央服务器基于所有判断结果判断是否训练完成。本发明模型训练方法支持神经网络模型训练数据和全局模型的分离,实现了对私有数据的隐私保护,大幅增强了私有数据的安全性和保密性。

技术领域

本发明涉及图像处理技术领域,尤其涉及一种晶体衍射图像筛选模型训练方法及晶体衍射图像筛选方法。

背景技术

同步辐射光源具有高强度、高亮度、高准直性等特性,可用以从事多学科的前沿基础研究,例如使用其中的硬X射线对蛋白质等大分子进行晶体衍射是常用的实验方法。但硬X射线自由电子激光的平均数据带宽是2~20GB/s,峰值为100GB/s,高速的数据流给数据的存储和传输带来了巨大的压力,并且由于衍射图像的高维性给数据的后续处理带来了严峻的问题。为了减轻后续数据传输和存储的压力,可采用深度学习方法对无效的图像数据进行筛选和抛弃。

神经网络模型的训练需要大量的图像数据,这些图像数据来源于不同的研究小组,由于这些数据包含重大科学发现的机遇,具有高度的科研价值,并且存在数据版权保护的困难,为了避免数据泄露造成科研损失,需要提供基于数据隐私保护的深度学习方法。现有的一种深度学习方法为联邦学习方法,其原理为根据多个客户端的调度信息,从多个客户端中选择一个作为中央服务器对全局模型进行聚合,从而达到对客户端数据隐私进行保护的作用。现有的另外一种学习方法为基于non-LLD数据的半监督联邦学习方法,该方法的中央服务器随机选择一定比例的客户端参与全局模型的更新,解决了联邦学习方法中缺乏标记数据的问题。但是上述学习方法的复杂度较高,时间开销较大,对高速数据的处理效率比较低,不适合高数据流量、低延迟要求的光源场景,同时也导致现有的衍射图像识别方法准确率低下,识别速度过慢等问题。

发明内容

本发明所要解决的技术问题是现有的衍射图像的筛选方法衍射图像识别准确率低下,识别速度过慢。

为了解决上述技术问题,本发明提供了一种晶体衍射图像筛选模型训练方法,包括:

每个所述训练小组分别基于其对应的本地训练数据集对对应的本地衍射图像筛选模型进行训练,以获取每个所述训练小组对应的训练完成衍射图像筛选模型;

所有所述训练小组分别将其对应的训练完成衍射图像筛选模型的模型参数发送给所述中央服务器;

所述中央服务器基于预设聚合方式对所有所述模型参数进行聚合,以获取全局梯度参数组,并基于所述全局梯度参数组更新衍射图像筛选全局模型;

每个所述训练小组分别判断其预设训练轮次组内获取的所述训练完成衍射图像筛选模型是否符合预设识别准确率条件以获取判断结果,并将所述判断结果发送给所述中央服务器;

所述中央服务器基于所有所述判断结果判断是否所有所述训练小组均完成识别率不再降低要求,若是则将当前所述衍射图像筛选全局模型作为训练完成衍射图像筛选全局模型,否则将当前所述全局梯度参数组分别发送给所有所述训练小组,每个所述训练小组分别基于所述全局梯度参数组对齐对应的所述本地衍射图像筛选模型进行更新,并重新分别基于对应的本地训练数据集对对应的本地衍射图像筛选模型进行训练,以实现新一轮次的训练;

其中,每个所述训练小组的初始本地衍射图像筛选模型由所述中央服务器发送,且所有所述训练小组的初始本地衍射图像模型均相同,所有所述训练小组均具有其对应的本地训练数据集,且不同本地训练数据集中的图像数据属于不同蛋白质分子的晶体衍射图像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海高等研究院,未经中国科学院上海高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210354459.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top