[发明专利]面向边缘计算的重参数神经网络架构搜索方法有效
申请号: | 202110991876.7 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113435590B | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 张铭扬;高丰;汤志航;杨涛;郑欢欢;王晓江;郁善金 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉;杨小凡 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 边缘 计算 参数 神经网络 架构 搜索 方法 | ||
1.面向边缘计算的重参数神经网络架构搜索方法,其特征在于包括如下步骤:
S1,设计各个支路的算子以及搜索空间,为原始卷积设置支路,构成多分支块,用于提取不同视野下的图片特征;
S2,构建包含所有支路的超级网络,通过不断堆叠多分支块,构建支路的网络结构;
S3,通过离散神经网络架构搜索方法,在给定显存限制下,训练超级网络,包括如下步骤:
S31,给定显存最大限制C,初始化每条支路的结构参数α和权重参数θ;
S32,计算每条支路的重要性:
(1)
其中,
S33,计算每条支路是否激活:
(2)
其中
S34,获取训练数据,多分支块中的每条支路获取不同的图像特征,激活公式(2)中值为1的支路,进行前向推理,之后计算预测的图像分类标签与真实的图像分类标签的损失函数L;
S35,通过反向传播,分别计算权重参数θ和激活参数Z在损失函数L上的梯度,所述激活参数Z是由
(3)
S36,根据对L的梯度,更新权重参数θ,同时根据如下公式更新结构参数ɑ:
(4)
其中
S37,回到S32,直至超级网络中的权重参数和结构参数训练到收敛;
S4,将训练后多余的支路从超级网络中去除,得到最佳子网络,根据公式(2)去除经过步骤3训练的超级网络中未激活的支路;
S5,将多支路的最佳子网络融合成单支路的最佳子网络;
S6,使用单支路的最佳子网络获取图像特征,进行实时推理,将融合后的单支路网络进行图像分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110991876.7/1.html,转载请声明来源钻瓜专利网。