[发明专利]在训练神经网络中作为正则化器的冻结在审

专利信息
申请号: 202011640152.X 申请日: 2020-12-31
公开(公告)号: CN113177639A 公开(公告)日: 2021-07-27
发明(设计)人: 谭涛;张敏;戈帕尔·比利杰里·阿维纳什;莱海尔·费伦齐;列文特·伊姆雷·特罗克;帕尔·泰格泽什 申请(专利权)人: 通用电气精准医疗有限责任公司
主分类号: G06N3/08 分类号: G06N3/08
代理公司: 上海专利商标事务所有限公司 31100 代理人: 钱慰民;张鑫
地址: 美国威*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 训练 神经网络 作为 正则 冻结
【说明书】:

发明题为在训练神经网络中作为正则化器的冻结。本发明提出了促进在训练神经网络中作为正则化器的冻结的系统和技术。系统可包括存储器和执行计算机可执行组件的处理器。该计算机可执行组件可包括:评估组件,该评估组件识别神经网络的单元;选择组件,该选择组件选择神经网络的单元的子集;和冻结组件,该冻结组件冻结神经网络的单元的选定子集,使得针对训练运行将不更新来自单元的冻结子集的输出连接的权重。

技术领域

本公开整体涉及神经网络,并且更具体地讲,涉及用于训练神经网络 的计算机实现的技术。

背景技术

当训练神经网络时,过度拟合是常见问题。当神经网络模型太好地学 习训练数据时,在训练过程期间发生过度拟合,从而在向模型呈现新的未 见数据时导致较低的性能。可通过将验证度量诸如准确度应用于新的未见 数据(测试数据)和训练数据来检测过度拟合。当发生过度拟合时,针对 测试数据的验证度量在特定数量的时期之后停止改善并且此后开始减少。 同时,因为模型试图找到训练数据的最佳拟合,所以针对训练数据的验证 度量将继续改善。与训练数据相关联的误差被驱动到非常小的值,但是在 向神经网络呈现新数据时,误差很大。网络已了解训练示例,但其尚未了 解推广至新情况或数据集。

正则化是指通过对学习算法进行轻微修改来解决过度拟合问题,从而 使得神经网络模型能够更准确地推广至新情况或数据集的技术。这继而也 改善模型对新数据的性能。

丢弃是指在训练运行(例如,一个或多个训练迭代)期间从神经网络 层随机移除特定百分比的隐藏单元(连同它们的连接)的正则化技术。这 防止了隐藏单元太多地依赖其他隐藏单元。然而,通过丢弃隐藏单元连同 它们的连接,神经网络的架构对于适用的训练运行发生改变。因此,有必 要在每次训练运行期间更新从丢弃单元到下一层或多层的单元的输出连接 的权重。

发明内容

以下内容提出了本说明书的简化发明内容以便提供对本说明书的某些 方面的基本理解。该发明内容不是对本说明书的详尽概述。它既不旨在标 识本说明书的关键或重要元素,也不旨在描述本说明书的特定具体实施的 任何范围或权利要求的任何范围。其唯一目的是以简化形式呈现本说明书 的一些概念,作为稍后呈现的更详细描述的序言。

根据一个实施方案,一种系统包括评估组件、选择组件和冻结组件。 该评估组件识别神经网络的单元。该选择组件选择神经网络的单元的子 集。该冻结组件冻结神经网络的单元的选定子集,使得针对训练运行将不 更新来自单元的冻结子集的输出连接的权重。

根据另一个实施方案,提供了一种方法。该方法包括由可操作地耦接 到处理器的设备识别神经网络的单元。该方法还包括由设备选择神经网络 的单元的子集。此外,该方法包括由设备冻结神经网络的单元的选定子 集,使得针对训练运行将不更新来自单元的冻结子集的输出连接的权重。

根据又一个实施方案,提供了一种计算机可读存储设备。该计算机可 读存储设备包括指令,指令响应于执行而致使包括处理器的系统执行操 作,操作包括识别神经网络的单元。该处理器还执行操作,包括选择神经 网络的单元的子集。该处理器还执行操作,包括冻结神经网络的单元的选 定子集,使得针对训练运行将不更新来自单元的冻结子集的输出连接的权 重。

以下具体实施方式和附图阐述了本说明书的某些例示性方面。然而, 这些方面仅指示了可以采用本说明书原理的各种方式中的一些方式。当结 合附图考虑时,根据以下对说明书的详细描述,本说明书的其他优点和新 颖特征将变得显而易见。

附图说明

图1示出了根据本文所述的一个或多个实施方案的示例性、非限制性 系统的框图,该系统促进在训练神经网络中作为正则化器的冻结。

图2A至图2D分别示出了根据本文所述的一个或多个实施方案的非限 制性系统的示例,该系统促进在训练神经网络中作为正则化器的冻结。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用电气精准医疗有限责任公司,未经通用电气精准医疗有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011640152.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top