[发明专利]具有本地化存储器的矩阵处理器在审
申请号: | 201780065339.1 | 申请日: | 2017-10-05 |
公开(公告)号: | CN109863477A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 李静;张嘉亮 | 申请(专利权)人: | 威斯康星校友研究基金会 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/48 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;陈炜 |
地址: | 美国威*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储器 计算机架构 矩阵处理器 外部存储器 处理算法 处理元件 矩阵乘法 矩阵运算 有效处理 数据流 共享 逻辑列 逻辑行 关联 | ||
1.一种用于矩阵计算的计算机架构,包括:
一组处理元件,所述一组处理元件各自被布置在多个逻辑行中的一行和多个逻辑列中的一列中,并且所述一组处理元件各自沿着第一数据线和第二数据线接收第一操作数和第二操作数以根据所述处理元件的操作提供输出结果,其中,所述第一数据线各自连接至所述多个逻辑行中的每个逻辑行中的多个处理元件,并且所述第二数据线各自连接至所述多个逻辑列中的每个逻辑列中的逻辑处理元件;
本地存储器元件,所述本地存储器元件与所述第一数据线和所述第二数据线中的每一个数据线相关联,以同时向通过所述第一数据线和所述第二数据线互连的每个处理元件提供给定的操作数;以及
调度器,所述调度器将数据从外部存储器传输至所述本地存储器元件,并且顺序地将存储在所述本地存储器元件中的操作数应用于所述第一数据线和所述第二数据线,以使用所述操作数来实现矩阵计算。
2.根据权利要求1所述的计算机架构,其中,所述本地存储器元件位于还容纳所述处理元件的单个集成电路基板上。
3.根据权利要求2所述的计算机架构,其中,所述本地存储器元件被分布在所述集成电路上。
4.根据权利要求3所述的计算机架构,其中,每个给定的本地存储器接近相应的给定处理元件。
5.根据权利要求4所述的计算机架构,其中,所述处理元件通过可编程互连结构进行互连。
6.根据权利要求5所述的计算机架构,其中,所述集成电路是现场可编程门阵列。
7.根据权利要求1所述的计算机架构,其中,所述计算机架构至少提供八个逻辑行和八个逻辑列。
8.根据权利要求1所述的计算机架构,其中,所述处理元件在二维中以物理行和物理列的方式分布在集成电路的表面上。
9.根据权利要求1所述的计算机架构,还包括纵横式交换机,所述纵横式交换机由所述调度器控制以在将接收自所述外部存储器的数据传输至与所述第一数据线和所述第二数据线中的特定数据线相关联的所述本地存储器元件中时提供对该数据的可编程排序,所述可编程排序适合于实现矩阵计算。
10.根据权利要求1所述的计算机架构,其中,所述处理元件提供乘法运算。
11.根据权利要求10所述的计算机架构,其中,所述处理元件包括查找表乘法器。
12.根据权利要求10所述的计算机架构,还包括累加器,在顺序将数据值从所述本地存储器元件应用到所述处理元件之间所述累加器对来自所述处理元件的输出进行求和。
13.根据权利要求12所述的计算架构,还包括输出多路复用器,所述输出多路复用器由所述调度器控制将数据从所述累加器传输至外部存储器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于威斯康星校友研究基金会,未经威斯康星校友研究基金会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780065339.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:动态变量精度计算
- 下一篇:用于异构并行结构的细粒度功率优化