[发明专利]浮点可分离卷积计算加速装置、系统以及图像处理方法有效
| 申请号: | 202110061071.2 | 申请日: | 2021-01-18 |
| 公开(公告)号: | CN112836793B | 公开(公告)日: | 2022-02-08 |
| 发明(设计)人: | 张志超;刘忠麟;王志乾;喻金桃;蒋丽婷 | 申请(专利权)人: | 中国电子科技集团公司第十五研究所 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06F7/485;G06F15/78 |
| 代理公司: | 北京理工大学专利中心 11120 | 代理人: | 高会允 |
| 地址: | 100083 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 浮点 可分离 卷积 计算 加速 装置 系统 以及 图像 处理 方法 | ||
1.一种浮点可分离卷积计算加速装置,包括点卷积模块,所述点卷积模块,利用第一输入参数数据对第一输入特征图数据进行卷积加速计算,输出第一输出特征图数据;其特征在于,所述浮点可分离卷积计算加速装置还包括深度分离卷积模块;
所述深度分离卷积模块的输入为第二输入特征图数据;所述深度分离卷积模块通过设置第二输入参数数据,对所述第二输入特征图数据进行卷积加速运算,得到第二输出特征图数据;其中第二输出特征图数据作为所述第一输入特征图数据;
所述深度分离卷积模块包括:深度分离卷积乘法矩阵单元和深度分离卷积前向累加树矩阵;
所述深度分离卷积乘法矩阵单元,包括PE×1个浮点卷积乘法计算器,所述浮点卷积乘法计算器的延迟不局限于1个时钟周期的延迟;所述深度分离卷积乘法矩阵单元的输入为第二输入特征图数据和第二输入参数数据,每个时钟周期的第二输入特征图数据为1个浮点数据Ipt0,第二输入参数数据为PE个浮点数据即Wgt0~WgtPE;输出为深度分离卷积乘法结果,包含PE×1个浮点数据;
所述深度分离卷积前向累加树矩阵单元,包含PE个前向累加树,完成k×k个卷积核大小的深度分离卷积乘法结果累加计算;所述深度分离卷积前向累加树矩阵单元的输入为所述深度分离卷积乘法结果,输出为第二输出特征图数据,包含PE×1个浮点数据;
所述前向累加树采用两组输入时序调度模块与加法树串联而成,顺次为第一输入时序调度模块、第一加法树、第二输入时序调度模块和第二加法树;
深度分离卷积乘法矩阵单元输出的深度分离卷积乘法结果输入至所述第一输入时序调度模块,第一输入时序调度模块完成k个时钟周期的时序数据寄存,为第一加法器准备k个输入时序数据,第一加法树完成对k个输入时序数据的累加求和,第一加法器的求和结果输入至所述第二输入时序调度模块,第二输入时序调度模块对第一加法树的k个求和结果进行寄存,完成k×k个时钟周期的时序数据寄存,为第二加法器准备k个输入,第二加法树对第一加法树的k个求和结果进行累加求和,前向累加树共计完成k×k个时钟周期的时序数据的累加求和,输出第二输出特征图数据,作为第一输入特征图数据输入至所述点卷积模块;
所述点卷积模块的输出为第一输出特征图数据,作为最终的可分离卷积输出结果。
2.如权利要求1所述的装置,其特征在于,所述第一输入时序调度模块与所述第二输入时序调度模块结构相同,由输入寄存器、计数器和k个内部寄存器组成;
输入寄存器连接计数器,k个内部寄存器均直接连接所述计数器;
所述输入寄存器接收k个时钟周期的输入数据送入所述计数器;
所述计数器采用取模k的方式寄存输入数据至k个内部寄存器中,寄存k个输入数据后,k个内部寄存器一次性输出k个数据。
3.如权利要求2所述的装置,其特征在于,所述加法树包括k-1个浮点加法器,用于完成k个数据的累加求和运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所,未经中国电子科技集团公司第十五研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110061071.2/1.html,转载请声明来源钻瓜专利网。





