[发明专利]深度可分离卷积的加速方法和存储介质有效
| 申请号: | 201911336362.7 | 申请日: | 2019-12-23 |
| 公开(公告)号: | CN111079904B | 公开(公告)日: | 2023-05-23 |
| 发明(设计)人: | 许勇;刘灵辉 | 申请(专利权)人: | 福建星网视易信息系统有限公司 |
| 主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06F9/38;G06F9/30 |
| 代理公司: | 福州市景弘专利代理事务所(普通合伙) 35219 | 代理人: | 张忠波;徐剑兵 |
| 地址: | 350008 福建省福州市仓山区金山*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种深度可分离卷积的加速方法和存储介质,包括步骤:计算深度可分离卷积的输入/输出数据的排序,使所述输入/输出数据在内存中按卷积时的访问顺序连续存储;计算矩阵卷积所需的寄存器数量nr,nr=k×k+k+rk,其中,k为深度卷积系数大小,rk为k按vn向上取整的数量;判断矩阵卷积所需的寄存器数量nr是否小于等于SIMD寄存器组所能存储的vn数量tn,若是,则使用SIMD寄存器组直接进行深度可分离卷积,若否,则将系数矩阵分成mk份,每次处理nk行,使mk×nk小于等于k,以及使tr取小于tn的最大值,其中,所述tr=k×nk+nk+rk。本发明可降低加载存储指令的内存访问停顿,以及最大限度使用SIMD寄存器进行卷积,从而提高深度可分离卷积的计算效率。 | ||
| 搜索关键词: | 深度 可分离 卷积 加速 方法 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建星网视易信息系统有限公司,未经福建星网视易信息系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911336362.7/,转载请声明来源钻瓜专利网。





