[发明专利]训练神经网络模型在审
申请号: | 201880088144.3 | 申请日: | 2018-11-30 |
公开(公告)号: | CN111656373A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | D·马夫里厄杜斯;B·G·格布雷;S·特拉亚诺夫斯基 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 李光颖 |
地址: | 荷兰艾*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 神经网络 模型 | ||
1.一种被配置用于训练神经网络模型的系统(300),所述系统(300)包括:
存储器(306),其包括表示指令集的指令数据;以及
处理器(302),其被配置为与所述存储器(306)通信并且执行所述指令集,其中,当由所述处理器执行时,所述指令集令所述处理器:
接收包括第一组注释图像的训练数据;
接收包括第二组注释图像的测试数据;
使用所述训练数据基于初始正则化参数来训练所述神经网络模型;以及
迭代地执行以下步骤:
使用所述测试数据来测试经训练的神经网络模型,以确定经训练的神经网络模型的针对所述测试数据的损失函数;
基于所述神经网络模型的针对所述训练数据的损失函数和所述神经网络模型的损失函数来调整所述初始正则化参数;
使用所述训练数据基于经调整的正则化参数来再训练所述神经网络模型;
其中,所述迭代的步骤被执行直至确定针对所述训练数据的所述损失函数和针对所述测试数据的所述损失函数都已经收敛到稳定状态。
2.根据权利要求1所述的系统(300),其中,所述正则化参数包括以下中的至少一项:与所述神经网络模型中的神经元相关的dropout参数或与所述神经网络模型中的神经元之间的连接相关的dropconnect参数。
3.根据权利要求1或权利要求2所述的系统(300),其中,对所述正则化参数进行的所述调整基于所述神经网络模型的针对所述训练数据的所述损失函数与所述神经网络模型的针对所述测试数据的所述损失函数之间的差。
4.根据权利要求1至3中任一项所述的系统(300),其中,令所述处理器(302)调整所述正则化参数包括,当确定所述神经网络模型的所述损失函数针对所述测试数据比针对所述训练数据更高并且所述损失函数已经针对所述训练数据最小化时,令所述处理器增加所述正则化参数。
5.根据权利要求1至4中任一项所述的系统(300),其中,令所述处理器(302)调整所述正则化参数包括,当确定所述神经网络模型的所述损失函数针对所述训练数据比针对所述测试数据更高时,令所述处理器减小所述正则化参数。
6.根据权利要求1至5中任一项所述的系统(300),其中,令所述处理器(302)训练所述神经网络模型或再训练所述神经网络模型包括,使用所述训练数据迭代地训练所述神经网络模型直至针对所述训练数据的所述神经网络模型的损失函数收敛到稳定状态。
7.根据权利要求6所述的系统(300),其中,令所述处理器(302)再训练所述神经网络模型包括,令所述处理器基于前次迭代期间的所述神经网络模型的一个或多个层中的神经元的权重来设置所述神经元的权重。
8.根据权利要求6或权利要求7所述的系统(300),其中,当所述神经网络模型的所述损失函数在随后的迭代之间改变小于限定量时,所述神经网络模型的针对所述训练数据的损失函数被认为已经收敛到稳定状态。
9.根据权利要求1至8中任一项所述的系统(300),其中,所述训练数据和所述测试数据都包括利用以下中的至少一项注释的图像:所述图像中的对象的存在的指示;以及所述图像中的对象的位置的指示。
10.根据权利要求9所述的系统(300),其中,所述训练数据和所述测试数据都包括医学图像。
11.根据权利要求1至10中任一项所述的系统(300),其中,所述正则化参数限定要在训练期间从所述神经网络模型的具体层暂时排除的神经元或神经元之间的连接的比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880088144.3/1.html,转载请声明来源钻瓜专利网。