[发明专利]用于深度神经网络的经学习阈值修剪在审
申请号: | 202080068674.9 | 申请日: | 2020-10-10 |
公开(公告)号: | CN114467098A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | K·阿扎里安·雅兹迪;T·P·F·布兰克沃特;J·W·李;Y·S·巴尔加特 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈炜;亓云 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 深度 神经网络 经学 阈值 修剪 | ||
1.一种方法,包括:
基于分类损失和正则化损失的函数来确定用于修剪多个预训练权重中的第一组预训练权重的修剪阈值;
响应于所述第一组预训练权重中的每个预训练权重的第一值大于所述修剪阈值来修剪所述第一组预训练权重;以及
响应于所述多个预训练权重中的第二组预训练权重中的每个预训练权重的第二值大于所述修剪阈值来调整所述第二组预训练权重。
2.如权利要求1所述的方法,进一步包括:作为所述多个预训练权重中的预训练权重与可微函数的乘积来确定可微的经修剪权重,所述可微函数基于所述预训练权重、所述修剪阈值和用于平滑所述可微函数的温度来确定修剪值。
3.如权利要求2所述的方法,进一步包括:基于所述修剪阈值的第一梯度和所述多个预训练权重的第二梯度来使所述分类损失最小化。
4.如权利要求2所述的方法,进一步包括:基于针对人工神经网络的每一层确定的所述修剪值来确定所述正则化损失。
5.如权利要求1所述的方法,进一步包括:基于修剪偏好值来归一化所述正则化损失,其中确定所述修剪阈值包括基于所述分类损失和归一化的正则化损失来确定总损失。
6.如权利要求5所述的方法,进一步包括:
将人工神经网络分发给联合学习系统的用户设备;以及
基于所述用户设备的硬件简档来配置所述修剪偏好值。
7.如权利要求6所述的方法,进一步包括:从所分发的人工神经网络中排除所述第一组预训练权重。
8.一种装置,包括:
存储器;以及
耦合至所述存储器的至少一个处理器,所述至少一个处理器被配置成:
基于分类损失和正则化损失的函数来确定用于修剪多个预训练权重中的第一组预训练权重的修剪阈值;
响应于所述第一组预训练权重中的每个预训练权重的第一值大于所述修剪阈值来修剪所述第一组预训练权重;以及
响应于所述多个预训练权重中的第二组预训练权重中的每个预训练权重的第二值大于所述修剪阈值来调整所述第二组预训练权重。
9.如权利要求8所述的装置,其中所述至少一个处理器被进一步配置成:作为所述多个预训练权重中的预训练权重与可微函数的乘积来确定可微的经修剪权重,所述可微函数基于所述预训练权重、所述修剪阈值和用于平滑所述可微函数的温度来确定修剪值。
10.如权利要求9所述的装置,其中所述至少一个处理器被进一步配置成:基于所述修剪阈值的第一梯度和所述多个预训练权重的第二梯度来使所述分类损失最小化。
11.如权利要求9所述的装置,其中所述至少一个处理器被进一步配置成:基于针对人工神经网络的每一层确定的所述修剪值来确定所述正则化损失。
12.如权利要求8所述的装置,其中所述至少一个处理器被进一步配置成:基于修剪偏好值来归一化所述正则化损失,其中确定所述修剪阈值包括基于所述分类损失和归一化的正则化损失来确定总损失。
13.如权利要求12所述的装置,其中所述至少一个处理器被进一步配置成:
将人工神经网络分发给联合学习系统的用户设备;以及
基于所述用户设备的硬件简档来配置所述修剪偏好值。
14.如权利要求13所述的装置,其中所述至少一个处理器被进一步配置成:从所分发的人工神经网络中排除所述第一组预训练权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080068674.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:牙科用手持件
- 下一篇:从废干电池回收锰的方法和回收设备