[发明专利]具有本地化存储器的矩阵处理器在审
申请号: | 201780065339.1 | 申请日: | 2017-10-05 |
公开(公告)号: | CN109863477A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 李静;张嘉亮 | 申请(专利权)人: | 威斯康星校友研究基金会 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/48 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;陈炜 |
地址: | 美国威*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种计算机架构,所述计算机架构提供以逻辑行和逻辑列布置的多个处理元件以共享与每个列和行相关联的本地存储器。这种在行和列的基础上的存储器的共享提供有效的矩阵运算诸如矩阵乘法,例如可以用于各种处理算法中以减少外部存储器和本地存储器之间的数据流和/或降低用于有效处理所需的本地存储器的尺寸。 | ||
搜索关键词: | 存储器 计算机架构 矩阵处理器 外部存储器 处理算法 处理元件 矩阵乘法 矩阵运算 有效处理 数据流 共享 逻辑列 逻辑行 关联 | ||
【主权项】:
1.一种用于矩阵计算的计算机架构,包括:一组处理元件,所述一组处理元件各自被布置在多个逻辑行中的一行和多个逻辑列中的一列中,并且所述一组处理元件各自沿着第一数据线和第二数据线接收第一操作数和第二操作数以根据所述处理元件的操作提供输出结果,其中,所述第一数据线各自连接至所述多个逻辑行中的每个逻辑行中的多个处理元件,并且所述第二数据线各自连接至所述多个逻辑列中的每个逻辑列中的逻辑处理元件;本地存储器元件,所述本地存储器元件与所述第一数据线和所述第二数据线中的每一个数据线相关联,以同时向通过所述第一数据线和所述第二数据线互连的每个处理元件提供给定的操作数;以及调度器,所述调度器将数据从外部存储器传输至所述本地存储器元件,并且顺序地将存储在所述本地存储器元件中的操作数应用于所述第一数据线和所述第二数据线,以使用所述操作数来实现矩阵计算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于威斯康星校友研究基金会,未经威斯康星校友研究基金会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780065339.1/,转载请声明来源钻瓜专利网。
- 上一篇:动态变量精度计算
- 下一篇:用于异构并行结构的细粒度功率优化