[发明专利]一种硬件友好的神经网络结构自动搜索方法及装置有效
| 申请号: | 202010363633.4 | 申请日: | 2020-04-30 | 
| 公开(公告)号: | CN111582433B | 公开(公告)日: | 2022-07-15 | 
| 发明(设计)人: | 朱文武;王鑫;蒋昱航 | 申请(专利权)人: | 清华大学 | 
| 主分类号: | G06N3/02 | 分类号: | G06N3/02 | 
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 | 
| 地址: | 10008*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 硬件 友好 神经网络 结构 自动 搜索 方法 装置 | ||
1.一种硬件友好的神经网络结构自动搜索方法,其特征在于,包括以下步骤:
扩展原始网络结构中每层的通道数目上限,以扩大通道数目的全局搜索空间;
在每层通道数目的全局搜索空间中,测量不同输出分辨率下,每个通道数目在硬件上的实际推理时延;
利用所测量的实际推理时延数据,学习实际推理时延的模型,利用所述实际推理时延的模型预测每个通道数目的期望推理时延,根据所述实际推理时延和所述期望推理时延确定通道数目的分数;
将通道数目的全局搜索空间分成多个不同的通道组,根据通道数目的分数在每个通道组中选出每个通道的通道候选,从而在全局搜索空间中选出多个通道候选,构建出对所述硬件友好的搜索空间;
利用搜索算法在所构建的所述硬件友好的搜索空间中,找到所述硬件对应的神经网络结构。
2.根据权利要求1所述的硬件友好的神经网络结构自动搜索方法,其特征在于,所述实际推理时延的模型为:
f(x)=kxa+b
其中,k和b为待学习参数,x为通道数目,a为硬件相关的可调参数。
3.根据权利要求1所述的硬件友好的神经网络结构自动搜索方法,其特征在于,根据所述实际推理时延和所述期望推理时延确定通道数目的分数,包括:
将所述实际推理时延和所述期望推理时延的差值作为该通道数目的分数,s(x)=f(x)-m(x),其中,s(x)为通道数目的分数,f(x)为利用实际推理时延的模型预测的每个通道数目的期望推理时延,m(x)为实际推理时延。
4.根据权利要求1所述的硬件友好的神经网络结构自动搜索方法,其特征在于,所述根据通道数目的分数在每个通道组中选出每个通道的通道候选,包括:
在通道组中选出通道数目的分数最高的通道数目作为通道组的通道候选。
5.根据权利要求1所述的硬件友好的神经网络结构自动搜索方法,其特征在于,所述利用搜索算法在所构建的硬件友好的搜索空间中,找到所述硬件对应的神经网络结构,包括:
利用可导的搜索算法在所构建的硬件友好的搜索空间中,找到所述硬件对应的神经网络结构。
6.一种硬件友好的神经网络结构自动搜索装置,其特征在于,包括:
扩展模块,用于扩展原始网络结构中每层的通道数目上限,以扩大通道数目的全局搜索空间;
测量模块,用于在每层通道数目的全局搜索空间中,测量不同输出分辨率下,每个通道数目在硬件上的实际推理时延;
计算模块,用于利用所测量的实际推理时延数据,学习实际推理时延的模型,利用所述实际推理时延的模型预测每个通道数目的期望推理时延,根据所述实际推理时延和所述期望推理时延确定通道数目的分数;
构建模块,用于将通道数目的全局搜索空间分成多个不同的通道组,根据通道数目的分数在每个通道组中选出每个通道的通道候选,从而在全局搜索空间中选出多个通道候选,构建出对所述硬件友好的搜索空间;
搜索模块,用于利用搜索算法在所构建的所述硬件友好的搜索空间中,找到所述硬件对应的神经网络结构。
7.根据权利要求6所述的硬件友好的神经网络结构自动搜索装置,其特征在于,所述实际推理时延的模型为:
f(x)=kxa+b
其中,k和b为待学习参数,x为通道数目,a为硬件相关的可调参数。
8.根据权利要求6所述的硬件友好的神经网络结构自动搜索装置,其特征在于,根据所述实际推理时延和所述期望推理时延确定通道数目的分数,包括:
将所述实际推理时延和所述期望推理时延的差值作为该通道数目的分数,s(x)=f(x)-m(x),其中,s(x)为通道数目的分数,f(x)为利用实际推理时延的模型预测的每个通道数目的期望推理时延,m(x)为实际推理时延。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010363633.4/1.html,转载请声明来源钻瓜专利网。





