[发明专利]一种深度神经网络的压缩方法、装置及计算机可读存储介质在审

申请号：	201910002531.7	申请日：	2019-01-02
公开（公告）号：	CN111401544A	公开（公告）日：	2020-07-10
发明（设计）人：	鲍媛媛	申请（专利权）人：	中国移动通信有限公司研究院;中国移动通信集团有限公司
主分类号：	G06N3/08	分类号：	G06N3/08
代理公司：	北京派特恩知识产权代理有限公司 11270	代理人：	高洁;张颖玲
地址：	100053 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种深度神经网络压缩方法装置计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种深度神经网络的压缩方法、装置及计算机可读存储介质，所述方法包括：基于预设训练集，预先训练得到初始深度神经网络；构建与所述预设训练集同分布的第一数据集；利用所述初始深度神经网络对所述第一数据集进行处理，得到所述第一数据集的标注集；构建浅层神经网络，基于所述第一数据集以及所述第一数据集的标注集，对所述浅层神经网络进行监督训练，得到所述浅层神经网络的网络参数。

技术领域

本发明涉及深度学习领域，尤其涉及一种深度神经网络的压缩方法、装置及计算机可读存储介质。

背景技术

现有的神经网络压缩方法主要有网络剪枝、权值量化两种，两种方式都是对初始训练得到的模型进行分析，通过权值阈值等方式确定剪枝、量化等操作的对象，因此，目前神经网络压缩方法没有从本质上改变网络结构，只是对网络结构进行微调整，因此涉及的模型参数值、计算量仍很大，致使神经网络模型部署在轻量级的设备上所需花费的成本仍很高。

发明内容

为解决上述技术问题，本发明实施例提供了一种深度神经网络的压缩方法、装置及计算机可读存储介质。

本发明实施例提供的一种深度神经网络的压缩方法，包括：

基于预设训练集，预先训练得到初始深度神经网络；

构建与所述预设训练集同分布的第一数据集；

利用所述初始深度神经网络对所述第一数据集进行处理，得到所述第一数据集的标注集；

构建浅层神经网络，基于所述第一数据集以及所述第一数据集的标注集，对所述浅层神经网络进行监督训练，得到所述浅层神经网络的网络参数。

其中，所述构建与所述预设训练集同分布的第一数据集，包括：

获取所述预设训练集X：

X＝{x_i，i＝1，2，3，…，m}；

其中，x_i＝{x_ij，j＝1，2，3，…，n}；m表示所述训练集X包含的样本个数，n表示样本x_i中包含的数值的个数，m和n均为正整数；

构建与X中每一个样本x_i距离最近的两个样本p_i和q_i：