[发明专利]用于基于硬件的池化的系统和方法在审
申请号: | 201880090044.4 | 申请日: | 2018-12-12 |
公开(公告)号: | CN111758107A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | P·J·班农;K·A·胡德 | 申请(专利权)人: | 特斯拉公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 马明月 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 基于 硬件 系统 方法 | ||
1.一种池化单元架构,包括:
控制器;
对准器,被耦合到所述控制器,所述对准器响应于接收输入数据而将所述输入数据对准到行中以生成池化阵列,并且所述对准器在多个算术循环上使所述行相对于彼此移位,以将所述输入数据重新格式化为经重新格式化的数据;以及
池化器,被耦合到所述对准器,所述池化器在随后的算术循环中,对经重新格式化的所述数据中的至少一些数据应用池化操作,以获得池化输出,所述池化输出包括池化值,其中来自每行的数据的子集被组合成数据的集合,所述池化值从所述数据的集合被生成。
2.根据权利要求1所述的池化单元,其中所述输入数据已经由矩阵处理器生成。
3.根据权利要求2所述的池化单元,其中为了维持所述输入数据的流,所述池化输出以与所述矩阵处理器生成所述输入数据的速率相同的速率被生成。
4.根据权利要求2所述的池化单元,其中所述池化器并行地执行一个或多个池化计算,并且其中所述池化计算的数目等于所述矩阵处理器中的输出通道的数目,使得所述池化输出对应于所述矩阵处理器的宽度,而与核大小无关。
5.根据权利要求1所述的池化单元,还包括:乘法和移位电路,被耦合到所述池化器,所述乘法和移位电路基于所述池化操作来生成所述池化输出。
6.根据权利要求1所述的池化单元,其中所述输入数据对应于一组特征图,并且其中所述池化器使用经重新格式化的所述输入数据,通过预定的因子来减小所述一组特征图的高度和宽度中的至少一者。
7.根据权利要求1所述的池化单元,其中所述行具有与所述输入数据相同的宽度,每行包括与矩阵中的一组邻域值相对应的数据的部分。
8.根据权利要求1所述的池化单元,还包括状态机,所述状态机将所述池化输出移位到输出阵列中。
9.根据权利要求1所述的池化单元,其中在不修改所述池化操作的序列本身的情况下,所述控制器确定池化操作中所涉及的数据点的数目和位置。
10.根据权利要求1所述的池化单元,其中从一行到另一行的移位对应于池化窗口的移位,所述池化窗口以一步幅值跨矩阵进行卷积,所述移位由所述算术循环的数目来限定。
11.一种用于使用基于硬件的池化系统的方法,所述方法包括:
从卷积引擎接收数据的阵列,所述数据的阵列表示卷积神经网络(CNN)中的卷积层的输出通道;
将所述数据的阵列转换为一组阵列,所述一组阵列根据池化操作而被对准,所述池化操作将数据应用于所述一组阵列中的至少两个阵列以生成池化结果;以及
将所述池化结果输出到存储器设备中。
12.根据权利要求11所述的方法,其中所述数据的阵列在基于硬件的池化单元处被接收。
13.根据权利要求11所述的方法,其中数据的阵列在多个算术循环的间隔处被接收。
14.根据权利要求11所述的方法,其中池化结果在每个间隔处被生成。
15.根据权利要求14所述的方法,其中池化结果在每个间隔处输出。
16.根据权利要求11所述的方法,其中所述数据的阵列对应于一组特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特斯拉公司,未经特斯拉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880090044.4/1.html,转载请声明来源钻瓜专利网。