[发明专利]一种基于乒乓RAM的条带阵列的卷积模块及其运算方法有效
申请号: | 201910791842.6 | 申请日: | 2019-08-26 |
公开(公告)号: | CN110688616B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 陈小柏;赖青松 | 申请(专利权)人: | 陈小柏 |
主分类号: | G06F17/15 | 分类号: | G06F17/15;G06F7/523 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 张金福 |
地址: | 511430 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 乒乓 ram 条带 阵列 卷积 模块 及其 运算 方法 | ||
1.一种基于乒乓RAM的条带阵列卷积模块,其特征在于:包括直接内存访问模块DMA、DMA控制器、数据分流模块、乒乓RAM、RAM读取模块、条带列阵模块、块累加模块、寄存器模块;
所述DMA控制器用于控制DMA从存储器中读取数据,所述数据包括特征feature、权重weight;数据经过数据分流模块将特征feature和权重weight分离,然后存入乒乓RAM;所述RAM读取模块从乒乓RAM读取特征feature和权重weight给到条带阵列模块进行运算处理,运算结果经过块累加模块输出;
所述寄存器模块用于接收来自中央处理器配置的寄存器控制所述的卷积模块运算。
2.根据权利要求1所述的基于乒乓RAM的条带阵列卷积模块,其特征在于:所述条带阵列模块包括Mk个PE运算单元,所述的PE运算单元包括Tk*Tk/2个乘法器。
3.根据权利要求2所述的基于乒乓RAM的条带阵列卷积模块,其特征在于:所述乒乓RAM包括特征RAM、权重RAM;所述特征RAM包括两个连续输出RAM,分别记为ramA、ramB,其中所述连续输出RAM包括Mk个子RAM;所述权重RAM包括ramA′、ramB′。
4.一种基于权利要求1~3任一项所述的基于乒乓RAM的条带阵列卷积模块的运算方法,其特征在于:所述运算方法包括步骤如下:
S1:设置权重weight单个卷积核寸尺为size×size;其中,size=1、2、3….n,条带阵列的PE运算单元的数量为Mk;
S2:特征Feature和权重weight按照N通道排列方式预先存储在存储器中,其中存储器存储的特征为三维矩阵,其宽度为Wi,高度为Hi,总通道数量为C,即特征的所有N通道累加和等于C,且设置每个N通道的特征Feature在存储器里面按连续地址存储;
S3:DMA从高度H方向、通道C方向对特征Feature进行分割,得到对应Cm×Hm份子特征,其中m为正整数;
S4:所述DMA控制器计算每一份子特征的地址、权重的地址,并通过DMA从内存读取子特征、权重,通过数据分流模块将子特征、权重进行分离;
S5:将子特征分成Mk份,缓存在连续输出RAM中的Mk个子RAM中,其中,每个子RAM中存有1/Mk份子特征的数据;同时权重缓存在权重RAM中;
S6:RAM读取模块根据地址计算公式计算连续输出RAM中Mk个子RAM中的数据,顺序读取并组成一份子特征;同时RAM读取模块读取在权重RAM中的权重;
S7:所述PE运算单元获取RAM读取模块输入的子特征、权重;PE运算单元中的乘法器对输入的子特征、权重进行乘法运算,得到相应的运算结果;
S8:块累加模块对高度H方向子特征的运算结果进行累加后输出。
5.基于权利要求4所述的基于乒乓RAM的条带阵列卷积模块的运算方法,其特征在于:所述N为2的次幂。
6.根据权利要求4所述的基于乒乓RAM的条带阵列卷积模块的运算方法,其特征在于:步骤S5,所述子特征缓存在特征RAM的具体步骤如下:
A1:所述DMA读取上个地址的子特征分成Mk份,分别存入ramA中Mk个子RAM中,其中每个子RAM存有1/Mk份子特征的数据;
A2:在RAM读取模块根据地址计算公式,顺序读取出ramA中Mk个子RAM中数据,组成子特征的同时,DMA将下个地址的子特征分成Mk份,分别存入ramB中Mk个子RAM,其中每个子RAM存有1/Mk份子特征的数据;
A3:当RAM读取模块读取完ramA中的子特征后,接着RAM读取模块根据地址计算公式,顺序读取ramB中Mk个子RAM中数据,组成子特征;
A4:重复以上步骤,直到读取完子特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陈小柏,未经陈小柏许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910791842.6/1.html,转载请声明来源钻瓜专利网。