[发明专利]用于深度神经网络的经学习阈值修剪在审

专利信息
申请号: 202080068674.9 申请日: 2020-10-10
公开(公告)号: CN114467098A 公开(公告)日: 2022-05-10
发明(设计)人: K·阿扎里安·雅兹迪;T·P·F·布兰克沃特;J·W·李;Y·S·巴尔加特 申请(专利权)人: 高通股份有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08
代理公司: 上海专利商标事务所有限公司 31100 代理人: 陈炜;亓云
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 深度 神经网络 经学 阈值 修剪
【说明书】:

一种用于基于经学习阈值来修剪人工神经网络的权重的方法包括:基于分类损失和正则化损失的函数来确定用于修剪多个预训练权重中的第一组预训练权重的修剪阈值。响应于第一组预训练权重中的每个预训练权重的第一值大于修剪阈值,第一组预训练权重被修剪。响应于该多个预训练权重中的第二组预训练权重中的每个预训练权重的第二值大于修剪阈值,微调或调整第二组预训练权重。

相关申请的交叉引用

本申请要求于2020年10月9日提交的题为“LEARNED THRESHOLD PRUNING FORDEEP NEURAL NETWORKS(用于深度神经网络的经学习阈值修剪)”的美国专利申请No.17/067,233的权益,该美国专利申请要求于2019年10月11日提交的题为“LEARNED THRESHOLDPRUNING FOR DEEP NEURAL NETWORKS(用于深度神经网络的经学习阈值修剪)”的美国临时专利申请No.62/914,233的权益,这些申请的公开内容通过援引全部明确纳入于此。

背景

技术领域

本公开的各方面一般涉及修剪深度神经网络。

背景技术

卷积神经网络使用许多计算和存储资源。因此,可能难以将传统的神经网络部署在具有有限资源的系统上,诸如云系统或嵌入式系统。一些传统的神经网络被修剪和量化以减少处理器和存储器使用。期望改进修剪方法以提高系统性能。

概述

在本公开的一方面,提供了一种方法。该方法包括:基于分类损失和正则化损失的函数来确定用于修剪多个预训练权重中的第一组预训练权重的修剪阈值。该方法还包括:响应于第一组预训练权重中的每个预训练权重的第一值大于该修剪阈值来修剪第一组预训练权重。另外,该方法包括:响应于该多个预训练权重中的第二组预训练权重中的每个预训练权重的第二值大于该修剪阈值来调整第二组预训练权重。

在本公开的另一方面,提供了一种装置。该装置包括存储器以及耦合至该存储器的一个或多个处理器。该处理器被配置成:基于分类损失和正则化损失的函数来确定用于修剪多个预训练权重中的第一组预训练权重的修剪阈值。该处理器还被配置成:响应于第一组预训练权重中的每个预训练权重的第一值大于该修剪阈值来修剪第一组预训练权重。另外,该处理器被配置成:响应于该多个预训练权重中的第二组预训练权重中的每个预训练权重的第二值大于该修剪阈值来调整第二组预训练权重。

在本公开的另一方面,提供了一种装备。该装备包括:用于基于分类损失和正则化损失的函数来确定用于修剪多个预训练权重中的第一组预训练权重的修剪阈值的装置。该装备还包括:用于响应于第一组预训练权重中的每个预训练权重的第一值大于该修剪阈值来修剪第一组预训练权重的装置。另外,该装备包括:用于响应于该多个预训练权重中的第二组预训练权重中的每个预训练权重的第二值大于该修剪阈值来调整第二组预训练权重的装置。

在本公开的进一步方面,提供了一种非瞬态计算机可读介质。该计算机可读介质上编码有程序代码。该程序代码由处理器执行并且包括:用于基于分类损失和正则化损失的函数来确定用于修剪多个预训练权重中的第一组预训练权重的修剪阈值的代码。该程序代码还包括:用于响应于第一组预训练权重中的每个预训练权重的第一值大于该修剪阈值来修剪第一组预训练权重的代码。此外,该程序代码包括:用于响应于该多个预训练权重中的第二组预训练权重中的每个预训练权重的第二值大于该修剪阈值来调整第二组预训练权重的代码。

本公开的附加特征和优点将在下文描述。本领域技术人员应当领会,本公开可容易地被用作修改或设计用于实施与本公开相同的目的的其他结构的基础。本领域技术人员还应认识到,这样的等效构造并不脱离所附权利要求中所阐述的本公开的教导。被认为是本公开的特性的新颖特征在其组织和操作方法两方面连同进一步的目的和优点在结合附图来考虑以下描述时将被更好地理解。然而,要清楚理解的是,提供每一幅附图均仅用于解说和描述目的,且无意作为对本公开的限定的定义。

附图简述

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202080068674.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top