[发明专利]基于脉动阵列的转置卷积和卷积加速器芯片设计方法在审

专利信息
申请号: 202110964659.9 申请日: 2021-08-20
公开(公告)号: CN113704172A 公开(公告)日: 2021-11-26
发明(设计)人: 罗国杰;马征征 申请(专利权)人: 北京大学
主分类号: G06F15/78 分类号: G06F15/78;G06F7/523;G06F7/50;G06F17/15;G06N3/04;G06N3/063
代理公司: 北京万象新悦知识产权代理有限公司 11360 代理人: 黄凤茹
地址: 100871*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 脉动 阵列 卷积 加速器 芯片 设计 方法
【权利要求书】:

1.一种基于脉动阵列的转置卷积和卷积加速器芯片设计方法,其特征是,通过设计与转置卷积网络模型和卷积网络模型的计算模式和访存模式相对应的芯片加速器阵列,并建立相应的数据流策略将转置卷积和卷积网络模型映射到芯片加速器阵列中,提高芯片加速性能;包括以下步骤:

1)设计芯片加速器处理单元,芯片处理单元包括:乘法器、加法器和加法器树;

所述乘法器和加法器用于输入图像元素和权重元素的乘累加操作,和中间结果的累加操作;加法器树用于在卷积操作中进行输入通道维度的累加计算;

2)设计芯片加速器互连网络模块;芯片加速器互连网络包括Mesh网络和输出重用通道;Mesh网络和输出重用通道均与水平和竖直方向相邻的处理单元相连接;Mesh网络用于传输权重和输入图像;输出重用通道用于传输处理单元生成的中间结果;

3)在芯片加速器阵列周围设计可重用缓存,作为芯片加速器片上存储模块,用于在运行转置卷积和卷积时,分别存储输入图像元素和权重元素,并存储生成的输出结果元素;

4)设计用于加速转置卷积的数据流与映射方法,采用“中间结果固定”的数据流方法,即将转置卷积的权重宽和权重长两个维度展开并映射到芯片加速器阵列的行上,将输入图像宽维度映射到芯片加速器阵列的列上,将输出通道维度映射到处理单元上;

当加速卷积操作时,采用“权重固定”的数据流方法,即将卷积的权重宽和权重长两个维度映射并固定在加速器阵列行上,将输出通道维度映射到加速器阵列的列上,将输入通道维度映射到处理单元上;或者采用“输出固定”的数据流方法,即将卷积的输出通道维度映射到加速器阵列的行上,将输入图像宽维度映射到加速器阵列的列上,将输入通道维度映射到处理单元上;

用于将转置卷积/卷积映射到加速器阵列的数据流映射方法具体包括:

4A)当加速器阵列运行转置卷积层时,展开加速器芯片的权重核高维度与权重核宽维度,并映射到加速器阵列的行上;将输入图像宽度维度映射到加速器阵列的列上;将输出通道维度映射到加速器阵列中的处理单元上;将权重数据和输入图像数据分别沿着水平方向和竖直方向,以脉动形式流入加速器阵列;

4B)当加速器阵列以输出固定方式运行卷积层时,将权重核高维度与权重核宽维度展开并映射到加速器阵列的行上;将输出通道维度映射到加速器阵列的列上;将输入通道维度映射到加速器阵列中的处理单元上;将输入图像数据沿着水平方向,以脉动形式流入加速器阵列;

4C)当加速器阵列以权重固定方式运行卷积层时,将输出通道维度维度展开并映射到加速器阵列的行上;将输入图像维度映射到加速器阵列的列上;将输入通道维度映射到加速器阵列中的处理单元上;权重数据和输入图像数据分别沿着水平方向和竖直方向,以脉动形式流入加速器阵列;

通过上述步骤,设计实现基于脉动阵列的转置卷积和卷积加速器芯片。

2.如权利要求1所述基于脉动阵列的转置卷积和卷积加速器芯片设计方法,其特征是,加速器芯片的处理单元具体包括如下模块:

2A)乘累加模块:用于对转置卷积/卷积层中的权重和输入图像数据进行乘累加操作;可包括支持并行计算的多个乘累加模块;

2B)乘累加寄存器:用于暂存乘累加模块的计算结果;处理单元中可包括支持并行计算的多个乘累加寄存器;

2C)加法树:

当把卷积层的输入通道维度映射在处理单元时,将多份乘累加模块的结果在加法树上进行归约相加;

2D)权重缓存:当加速器执行卷积运算时,将权重数据预存在权重缓存中;当处理单元接收到输入图像数据时,可从权重缓存中直接读取权重数据进行乘累加操作;

2E)加法器:用于在计算转置卷积/卷积层时,对计算得到的中间结果进行相加操作,从而生成最终输出结果;

2F)水平寄存器:用于在计算转置卷积时,暂存从相邻处理单元传输来的有水平重叠关系的中间结果;

2G)竖直寄存器:用于在计算转置卷积时,暂存从相邻处理单元传输来的有垂直重叠关系的中间结果;

2H)结果寄存器:用于在计算转置卷积/卷积时,存储经过加法器计算的中间结果;和/或,在计算转置卷积时,寄存器可用于路由节点,将数据传输至水平或竖直方向上的相邻计算单元。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110964659.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top