[发明专利]脉动阵列变速控制方法及可变速脉动阵列微框架系统有效
申请号: | 202010171246.0 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111401522B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 宋卓然;梁晓峣;景乃锋;官惠泽;江昭明;吴飞洋;江子山 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06F9/30 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 韩德祯 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 脉动 阵列 变速 控制 方法 框架 系统 | ||
本发明公开了一种脉动阵列变速控制方法和可变速脉动阵列微框架系统,其中方法包括:脉动阵列包括至少两个处理单元;方法包括:获取脉动阵列中所有处理单元的待转变精度模式;确定所有待转变精度模式中处理单元处理所需时长最长的处理周期,并将其作为脉动阵列的下一运行周期;在处理单元的下一实际处理周期后设置数个阻塞周期,以使得所有处理单元的下一处理周期的时长与脉动阵列的下一运行周期的时长相等。本发明可实现在多种精度下灵活切换,且每个固定周期下,脉动阵列内部的处理单元的精度可以是不同的,进而加速卷积神经网络的推理过程。
技术领域
本发明涉及神经网络技术领域,尤其涉及脉动阵列变速控制方法及可变速脉动阵列微框架系统。
背景技术
目前许多硬件公司开发了各种神经网络加速器来提高推理性能,其中脉动数组由于可以尽可能地重用获取的数据,因此算是一种有效地计算卷积的方法。
谷歌提出了一种基于经典脉动阵列的TPU架构,它由大量的运算单元组成,处理单元可以固定权值或特征值,通过在处理单元间滑动特征值或权值,从而减少了内存带宽,实现了高能效。同时还有几种类型的神经网络加速器支持混合精度计算以进一步提高计算效率。例如一种位串行乘法器,可以支持1位到8位的乘法以进行可重新配置的计算。在XilinxPYNQ-Z1板上,其峰值性能可以达到6.5TOPS。NVIDIA提出了Turing体系结构,它支持INT4,INT8和INT32整数计算,但是这些精度的运算无法同时运行。BitFusion则由包含融合单元的二维收缩阵列组成,融合单元可实现INT2,INT4,INT8和INT16操作,但该脉动阵列内部的融合单元必须设置为相同的精度,从而降低了混合精度计算的灵活性。
因此可看出现有脉动阵列均无法实现混合精度的卷积神经网络的推理过程。
发明内容
本发明所要解决的技术问题是现有的神经网络加速器无法实现混合精度的卷积神经网络的推理过程,现有脉动阵列无法实现变速控制,导致混合精度计算的灵活性较低。
为了解决上述技术问题,本发明提供了一种脉动阵列变速控制方法,所述脉动阵列包括至少两个处理单元;
所述方法包括:
获取所述脉动阵列中所有所述处理单元的待转变精度模式;
确定所有所述待转变精度模式中所述处理单元处理所需时长最长的处理周期,并将其作为所述脉动阵列的下一运行周期;
在所述处理单元的下一实际处理周期后设置数个阻塞周期,以使得所有所述处理单元的下一处理周期的时长与所述脉动阵列的下一运行周期的时长相等;
其中,所述处理单元每处理一个阻塞周期即表示所述处理单元被阻塞一个固定周期,设置的所述阻塞周期个数为自然数。
优选地,所述待转变精度模式包括:INT N*INT N模式、INT N*INT 2N模式、INT2N*INT N模式和INT 2N*INT 2N模式。
优选地,若当前所述脉动阵列中所有处理单元的精度模式为INT x*INT y模式,且所述处理单元处理INT x*INT y模式的实际处理周期为n个固定周期;
当所述待转变精度模式均为INT x’*INT y’模式时,所述脉动阵列的下一运行周期为(x’/x)*(y’/y)*n个固定周期,所有所述处理单元的下一处理周期中设置的阻塞周期为零个。
优选地,若当前所述脉动阵列中所有处理单元的精度模式为INT x*INT y模式,且所述处理单元处理INT x*INT y模式的实际处理周期为n个固定周期;
当所述待转变精度模式包括INT x’*INT y’模式和INT x”*INT y”模式时,判断n、(x’/x)*(y’/y)*n和(x”/x)*(y”/y)*n的大小;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010171246.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种圆柱电芯模组冷却系统
- 下一篇:一种建筑工程造价现场测绘装置