[发明专利]用于压缩神经网络的方法和装置有效
申请号: | 201711478743.X | 申请日: | 2017-12-29 |
公开(公告)号: | CN109993298B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 张刚 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06N3/0495 | 分类号: | G06N3/0495;G06N3/082 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 压缩 神经网络 方法 装置 | ||
本申请实施例公开了用于压缩神经网络的方法和装置。该方法的一具体实施方式包括:获取待压缩的经训练后的神经网络;从该神经网络的各层中选取至少一层作为待压缩层;按照待压缩层在该神经网络中所处的层级的层级数由大到小的顺序,依次对每个待压缩层执行以下处理步骤:基于指定数目,对该待压缩层中的参数进行量化,并利用机器学习方法,基于预置的训练样本对经量化后的神经网络进行训练;将对选取出的各个待压缩层进行该处理步骤后所得的神经网络确定为经压缩后的神经网络,并存储经压缩后的神经网络。该实施方式实现了对神经网络的有效压缩。
技术领域
本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及用于压缩神经网络的方法和装置。
背景技术
目前,随着人工智能不断的发展,神经网络的应用范围也在不断的扩展。这里,神经网络是人工神经网络的简称。神经网络可以应用于服务端,以对图像、文字、音频等进行处理。当然,现在神经网络还可以包含在客户端应用中。用户通过其终端设备所安装的客户端应用中的神经网络可以实现对图像、文字、音频等的编辑。
现有的神经网络通常占用较多的存储空间,例如磁盘空间或内存空间等。若用户在其持有的设备(例如智能手机、平板电脑等移动设备)上安装较多的包含神经网络的应用,那么该设备可能剩余较少的可用存储空间,该设备可能会出现运行速度慢、宕机等异常情况。
发明内容
本申请实施例提出了用于压缩神经网络的方法和装置。
第一方面,本申请实施例提供了一种用于压缩神经网络的方法,该方法包括:获取待压缩的经训练后的神经网络;从神经网络的各层中选取至少一层作为待压缩层;按照待压缩层在神经网络中所处的层级的层级数由大到小的顺序,依次对每个待压缩层执行以下处理步骤:基于指定数目,对该待压缩层中的参数进行量化,并利用机器学习方法,基于预置的训练样本对经量化后的神经网络进行训练;将对选取出的各个待压缩层进行上述处理步骤后所得的神经网络确定为经压缩后的神经网络,并存储经压缩后的神经网络。
在一些实施例中,从神经网络的各层中选取至少一层作为待压缩层,包括:若神经网络包括卷积层和全连接层,则选取至少一个卷积层和/或至少一个全连接层作为待压缩层。
在一些实施例中,基于指定数目,对该待压缩层中的参数进行量化,并利用机器学习方法,基于预置的训练样本对经量化后的神经网络进行训练,包括:执行以下量化训练操作:基于该待压缩层中的参数的参数值,确定包含指定数目个映射值的映射值集合;对该待压缩层中的参数进行量化以将该参数置为映射值集合中的映射值;利用机器学习方法,基于训练样本对经量化后的神经网络进行训练;如果当前经训练后的神经网络的精度不低于预设精度,则停止执行量化训练操作;如果当前经训练后的神经网络的精度低于预设精度,则扩大指定数目,并重新执行量化训练操作。
在一些实施例中,基于该待压缩层中的参数的参数值,确定包含指定数目个映射值的映射值集合,包括:按照参数值大小对该待压缩层中的参数进行排序,将经排序后的参数划分成指定数目个参数序列;对于每个参数序列,基于该参数序列中的参数的参数值,确定与该参数序列对应的映射值;将所确定的与指定数目个参数序列分别对应的映射值生成映射值集合。
在一些实施例中,基于该参数序列中的参数的参数值,确定与该参数序列对应的映射值,包括:若该参数序列中的参数的数量为奇数,则将该参数序列中的处于中间位置的参数的参数值确定为与该参数序列对应的映射值。
在一些实施例中,基于该参数序列中的参数的参数值,确定与该参数序列对应的映射值,还包括:确定该参数序列中的参数的参数值的平均值,将该平均值确定为与该参数序列对应的映射值。
在一些实施例中,对该待压缩层中的参数进行量化以将该参数的参数值置为映射值集合中的映射值,包括:对于该待压缩层中的每个参数,在上述指定数目个参数序列中确定该参数所在的目标参数序列,将该参数置为映射值集合中的与目标参数对应的映射值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711478743.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:量化实现方法及相关产品
- 下一篇:数据训练方法及装置、存储介质、电子装置