[发明专利]模型裁剪方法及装置在审
| 申请号: | 201811341888.X | 申请日: | 2018-11-12 |
| 公开(公告)号: | CN109460613A | 公开(公告)日: | 2019-03-12 |
| 发明(设计)人: | 贾开;魏铭 | 申请(专利权)人: | 北京迈格威科技有限公司 |
| 主分类号: | G06F17/50 | 分类号: | G06F17/50;G06N3/04 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 苏胜 |
| 地址: | 100000 北京市海淀区科*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及人工智能技术领域,提供一种模型裁剪方法及装置。其中,模型裁剪方法包括:从原始模型的结构参数中选择需要调整的第一结构参数;调整原始模型中第一结构参数的取值以改变原始模型的结构,比较确定原始模型中与参数调整后的模型存在结构差异第一模型子结构;多次调整第一模型子结构中第一结构参数的取值以裁剪第一模型子结构,获得多个第二模型子结构;获得对多个第二模型子结构进行测速的结果,根据结果从多个第二模型子结构中选择满足运行速度要求的第三模型子结构并构建裁剪后的模型;将原始模型中的其他参数迁移至裁剪后的模型中,获得参数迁移后的模型。该方法可以大幅提高模型的裁剪效率,同时裁剪后不会造成模型性能的明显下降。 | ||
| 搜索关键词: | 裁剪 子结构 原始模型 结构参数 迁移 人工智能技术 测速 参数调整 结构差异 速度要求 构建 | ||
【主权项】:
1.一种模型裁剪方法,其特征在于,包括:从原始模型的结构参数中选择需要调整的第一结构参数,其中,所述原始模型为深度神经网络模型,所述结构参数是指能够决定模型的结构的参数;通过调整所述原始模型中所述第一结构参数的取值以改变所述原始模型的结构,通过比较所述原始模型与参数调整后的模型,确定所述原始模型中与所述参数调整后的模型存在结构差异的第一模型子结构;通过多次调整所述第一模型子结构中所述第一结构参数的取值以裁剪所述第一模型子结构,在每次参数调整后获得一个裁剪出的第二模型子结构,共获得多个第二模型子结构;获得对所述多个第二模型子结构的运行速度进行测速的结果,根据所述结果从所述多个第二模型子结构中选择满足运行速度要求的第三模型子结构,并根据所述第三模型子结构构建裁剪后的模型;将所述原始模型中除所述第一结构参数以外的其他参数迁移至所述裁剪后的模型中,获得参数迁移后的模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811341888.X/,转载请声明来源钻瓜专利网。





