[发明专利]一种细粒度识别模型的压缩方法和设备有效

申请号：	202011285432.3	申请日：	2020-11-17
公开（公告）号：	CN112101487B	公开（公告）日：	2021-07-16
发明（设计）人：	尹继圣	申请（专利权）人：	深圳感臻科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/08;G06N3/04
代理公司：	深圳智趣知识产权代理事务所(普通合伙) 44486	代理人：	王策
地址：	518000 广东省深圳市南山区粤***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种细粒度识别模型压缩方法设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出一种细粒度识别模型的压缩方法和设备，包括：步骤1、获取用于细粒度识别的深度神经网络模型；步骤2、对深度神经网络模型的缩放因子添加L1正则约束后进行训练；步骤3、在完成训练后，根据缩放因子对训练完成后的深度神经网络模型进行逐层剪枝处理；步骤4、对完成剪枝的深度神经网络模型进行调整以减小剪枝对模型带来的精度损失，得到调整后的深度神经网络模型。步骤5、重复执行步骤2‑步骤4，直到得到的深度神经网络模型符合预设模型剪枝阈值的条件，且将符合条件的深度神经网络模型作为最终模型。本方案通过多次根据缩放因子对训练完成后的深度神经网络模型进行逐层剪枝处理的方式，有效压缩了深度神经网络模型。

技术领域

本发明涉及细粒度识别技术领域，特别涉及一种细粒度识别模型的压缩方法和设备。

背景技术

细粒度识别是一种针对具有细微差异物体进行分类的图像分类任务，深度模型在细粒度识别任务表现出优异的性能。细粒度识别能够在细粒度级别完成图像分类任务，通常识别的对象是同一个大类之间的物体，比如鸟的分类、车型识别等。细粒度识别广泛应用在车型识别、智能货柜、植物识别等场景中。等提出多种细粒度的深度模型并取得了很好的效果。

实际部署细粒度识别深度学习模型时，除了需要更精细粒度的准确率，还需要考虑模型运行时间复杂度和空间复杂度。在某些实际搭载的设备比如手机等终端设备，计算资源和存储资源有限，而度神经网络模型需要执行大量的浮点运算，并且有大量权重参数，比如ResNet50(Residual Network, 残差网络)需要执行5GFLOPs（Giga Floating-pointOperations Per Second,每秒10亿次的浮点运算数），有24M（Million，百万）个参数，这种情况严重制约了模型的实际应用。

由此，如何降低模型运算处理的时间复杂度和空间复杂度，使得可以在终端设备上部署细粒度识别模型成为目前需要解决的技术问题。

发明内容

针对现有技术中的缺陷，本发明提出了一种细粒度识别模型的压缩方法和设备，通过对细粒度识别模型的压缩，降低了模型运算处理的时间复杂度和空间复杂度，使得细粒度识别模型可以在终端设备上部署。

具体的，本发明提出了以下具体的实施例：

本发明实施例提出了一种细粒度识别模型的压缩方法，包括：

步骤1、获取用于细粒度识别的深度神经网络模型；

步骤2、对所述深度神经网络模型的缩放因子添加L1正则约束后进行训练；

步骤3、在完成训练后，根据所述缩放因子对训练完成后的所述深度神经网络模型进行逐层剪枝处理；

步骤4、对完成剪枝的所述深度神经网络模型进行调整以减小剪枝对所述模型带来的精度损失，得到调整后的所述深度神经网络模型；

步骤5、重复执行步骤2-步骤4，直到得到的所述深度神经网络模型符合预设模型剪枝阈值的条件，且将符合所述条件的所述深度神经网络模型作为最终模型。

在一个具体的实施例中，所述深度神经网络模型为Bi-Attention 模型；所述深度神经网络模型的骨干网络为ResNet50。

在一个具体的实施例中，所述步骤1包括：