[发明专利]一种用于CNN加速的OPU指令集定义方法有效
| 申请号: | 201910192455.0 | 申请日: | 2019-03-14 |
| 公开(公告)号: | CN110058882B | 公开(公告)日: | 2023-01-06 |
| 发明(设计)人: | 喻韵璇;王铭宇 | 申请(专利权)人: | 深圳市比昂芯科技有限公司 |
| 主分类号: | G06F9/30 | 分类号: | G06F9/30;G06N3/04 |
| 代理公司: | 成都正煜知识产权代理事务所(普通合伙) 51312 | 代理人: | 李龙 |
| 地址: | 518017 广东省深圳市福保街道福保社*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 cnn 加速 opu 指令 定义 方法 | ||
1.一种用于CNN加速的OPU指令集定义方法,其特征在于:包括定义有条件指令、定义无条件指令和设置指令颗粒度;
定义有条件指令包括如下步骤:
构建有条件指令,有条件指令包括读存储指令、写存储指令、数据抓取指令、数据后处理指令和计算指令;
设置有条件指令的寄存器和执行方式,执行方式为满足硬件写入的触发条件后执行,寄存器包括参数寄存器和触发条件寄存器;
设置有条件指令的参数配置方式,配置方式为根据无条件指令进行参数配置;
定义无条件指令包括如下步骤:
定义无条件指令的参数;
定义无条件指令参数的执行方式,执行方式为被读取后直接执行;
设置指令颗粒度包括如下步骤:
统计CNN网络和加速需求;
根据统计结果和选择的并行输入及输出通道决定计算模式,并设置指令颗粒度;
所述读存储指令包括按模式A1进行读存储操作和按模式A2进行读存储操作,其颗粒度为每次读入n个数,n1;
模式A1:从指定地址开始向后读n个数;
模式A2:根据地址流读n个数,其中,地址流中地址不连续,三种读数后操作:1,读取后无操作;2,读取后拼接为指定长度;3,读取后拆分为指定长度;四个读数操作后片上存储位置:特征图存储模块,内积参数存储模块,偏置参数存储模块,指令存储模块;
所述读存储操作指令可配参数包括起始地址、操作数数量、读取后处理模式和片上存储位置;
所述写存储指令包括按模式B1进行写存储操作和按模式B2进行写存储操作,其颗粒度为每次写出n个数,n1;
模式B1:从指定地址开始向后写n个数;
模式B2:根据目标地址流写n个数,其中,地址流中地址不连续;
所述写存储操作指令可配参数包括起始地址和操作数数量;
所述数据抓取指令包括根据不同读取数据模式和数据重组排列模式从片上特征图存储器和内积参数存储器读取数据操作和对读取的数据进行重组排列操作,其颗粒度为同时操作64个输入数据;数据抓取指令可配参数包括读特征图存储器和读内积参数存储器,其中,读特征图存储器包括读数地址约束即最小地址和最大地址、读数步长和重排模式;读内积参数存储器包括读数地址约束和读数模式;
所述数据后处理指令包括池化、激活、定点切割、取整、向量对位相加的一种操作或者多种操作,其颗粒度为每次操作64的倍数个数据;数据后处理操作指令可配参数包括池化类型、池化尺寸、激活种类和定点切割位置;
所述计算指令包括根据不同长度向量调配进行向量内积操作,其颗粒度为32,向量内积操作采用的计算基本单元为两个长度为32的向量内积模块,计算操作指令可调配参数包括输出结果数量;
所述无条件指令提供参数更新,参数包括片上存储特征图模块长,宽,通道数、当前层输入长,宽、当前层输入通道数,输出通道数、读存储操作起始地址、读操作模式选择、写存储操作起始地址、写操作模式选择、数据抓取模式及约束、设置计算模式、设置池化操作相关参数、设置激活操作相关参数和设置数据移位,剪切取整相关操作。
2.根据权利要求1所述的一种用于CNN加速的OPU指令集定义方法,其特征在于:还包括设置指令序列定义方式,具体为:指令序列若为连续的多条重复指令,则设置单一一条指令,该指令会被反复执行,直至触发条件寄存器和参数寄存器中内容被更新。
3.根据权利要求1所述的一种用于CNN加速的OPU指令集定义方法,其特征在于:还包括定义指令长度,指令长度为统一长度。
4.根据权利要求1所述的一种用于CNN加速的OPU指令集定义方法,其特征在于:并行输入及输出通道对应计算模式的最小单元为32的向量内积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市比昂芯科技有限公司,未经深圳市比昂芯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910192455.0/1.html,转载请声明来源钻瓜专利网。





