[发明专利]深度学习网络模型优化方法、装置及相关设备有效
| 申请号: | 201811616147.8 | 申请日: | 2018-12-27 |
| 公开(公告)号: | CN109740733B | 公开(公告)日: | 2021-07-06 |
| 发明(设计)人: | 王成波 | 申请(专利权)人: | 深圳云天励飞技术有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
| 代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 杨毅玲 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 深度 学习 网络 模型 优化 方法 装置 相关 设备 | ||
1.一种深度学习网络模型优化方法,其特征在于,所述方法包括:
获取深度学习网络模型的卷积层的输入数据,所述输入数据具有宽度、高度、通道数三个维度;
根据所述卷积层的卷积核的大小确定每个向量计算周期所述输入数据的加载次数;
在所述输入数据的通道维度上按照所述加载次数和预定的向量位宽加载所述输入数据预定区域的数据点,得到所述预定区域的向量数据,每次取预定的宽度和高度,保持宽度和高度不变,按照所述向量位宽取预定通道数的所述输入数据的数据点进行加载,所述向量位宽是计算机装置支持向量计算的位宽,所述向量位宽根据所述输入数据的数据点的位数确定,所述输入数据的数据点的位数越多,则所述向量位宽越小;
将所述预定区域的向量数据与所述卷积核对应相乘并累加,得到所述预定区域的向量输出。
2.如权利要求1所述的方法,其特征在于,所述深度学习网络模型为MobileNet网络模型。
3.如权利要求1所述的方法,其特征在于,所述每个向量计算周期所述输入数据的加载次数等于所述卷积核的宽度与高度的乘积。
4.如权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
根据所述输入数据不同区域的向量输出生成初始输出特征图。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
对所述初始输出特征图进行逐点卷积,得到目标输出特征图。
6.一种深度学习网络模型优化装置,其特征在于,所述装置包括:
获取单元,用于获取深度学习网络模型的卷积层的输入数据,所述输入数据具有宽度、高度、通道数三个维度;
确定单元,用于根据所述卷积层的卷积核的大小确定每个向量计算周期所述输入数据的加载次数;
加载单元,用于在所述输入数据的通道维度上按照所述加载次数和预定的向量位宽加载所述输入数据预定区域的数据点,得到所述预定区域的向量数据,每次取预定的宽度和高度,保持宽度和高度不变,按照所述向量位宽取预定通道数的所述输入数据的数据点进行加载,所述向量位宽是计算机装置支持向量计算的位宽,所述向量位宽根据所述输入数据的数据点的位数确定,所述输入数据的数据点的位数越多,则所述向量位宽越小;
计算单元,用于将所述预定区域的向量数据与所述卷积核对应相乘并累加,得到所述预定区域的向量输出。
7.一种计算机装置,其特征在于:所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中任一项所述深度学习网络模型优化方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述深度学习网络模型优化方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云天励飞技术有限公司,未经深圳云天励飞技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811616147.8/1.html,转载请声明来源钻瓜专利网。





