[发明专利]一种统一染色架构图形处理器单指令多线程染色簇系统有效
申请号: | 201611139607.3 | 申请日: | 2016-12-12 |
公开(公告)号: | CN106651742B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 田泽;任向隆;张骏;韩立敏;马城城;郑新建 | 申请(专利权)人: | 中国航空工业集团公司西安航空计算技术研究所 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 中国航空专利中心 11008 | 代理人: | 杜永保 |
地址: | 710000 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 统一 染色 架构 图形 处理器 指令 多线程 系统 | ||
1.一种统一染色架构图形处理器单指令多线程染色簇系统,其特征在于,包括:用于对warp执行的硬件载体SSC进行控制和调度的CU控制单元(3);用于对指令进行取指译码的FDU取指译码单元(2);用于加速指令存取速度的I$单元(4);若干用于执行染色程序的SPU染色处理单元(1);用于在SPU间共享数据的SSRAM单元(8);用于对内部存储器访问进行译码和仲裁控制的RAC单元(7);用于在SSRAM单元(8)、SPU染色处理单元(1)内部存储器和RF单元之间进行数据交换的LSU加载存储单元(6);用于加速常量存取的C$单元(5);
所述CU控制单元(3)具有与SSC单元外部的输入接口,用于从外部接收控制信息;所述CU控制单元(3)具有与SSC单元外部的输出接口,用于向外部输出状态信息;所述I$单元(4)具有与SSC单元外部的输入接口,用于从外部接收染色指令;所述C$单元(5)具有与SSC单元外部的输入接口,用于从外部接收染色所需常量参数;所述RAC单元(7)具有与SSC单元外部的输入、输出接口,分别用于从外部接收染色程序需要加工的输入数据,及向外部输出染色程序对输入数据加工后的输出结果;
所述的CU控制单元(3)与FDU取指译码单元(2)相连,用于和FDU取指译码单元(2)交互控制和状态信息,并告知FDU发射哪个warp的控制信号和数据到SPU上执行;所述SPU染色处理单元(1)与所述CU控制单元(3)相连,用于将SPU染色处理单元(1)的分支跳转结果发送到CU控制单元(3);所述I$单元(4)与FDU取指译码单元(2)连接,用于向FDU取指译码单元(2)提供染色指令;所述SPU染色处理单元(1)与FDU取指译码单元(2)连接,用于FDU取指译码单元(2)读取SPU染色处理单元(1)内部的寄存器文件;所述FDU取指译码单元(2)与SPU染色处理单元(1)、所述LSU加载存储单元(6)相连,用于向SPU染色处理单元(1)、LSU加载存储单元(6)提供指令译码后的控制信号和所需的源操作数;
所述SSRAM单元(8)与RAC相连,用于为LSU加载存储单元(6)和SSC单元外部对SSRAM单元(8)的访问提供数据通路;所述SPU染色处理单元(1)与RAC相连,用于为LSU加载存储单元(6)和SSC单元外部对SPU染色处理单元(1)内部的存储器访问提供数据通路;所述LSU加载存储单元(6)和所述RAC单元(7)相连,用于为LSU加载存储单元(6)通过RAC单元(7)对SSRAM单元(8)和SPU染色处理单元(1)内部存储器的访问提供数据通路;所述LSU加载存储单元(6)和SPU染色处理单元(1)相连,用于为LSU加载存储单元(6)的执行结果写入SPU染色处理单元(1)提供数据通路;所述C$单元(5)与LSU加载存储单元(6)连接,用于为LSU加载存储单元(6)对C$单元(5)的访问提供数据通路。
2.如权利要求1所述的一种统一染色架构图形处理器单指令多线程染色簇系统,其特征在于,
所述统一染色架构图形处理器单指令多线程染色簇结构的工作流程为:
1)外部模块将待加工数据通过接口c,经RAC单元(7)写入SPU染色处理单元(1);
2)外部模块将控制信息通过接口d,写入CU控制单元;
3)CU控制单元(3)检测到控制信息后,通知FDU取指译码单元(2)经I$单元(4)取回指令,译码后从SPU染色处理单元(1)取回数据,且:
a.如果是定点或浮点操作,则将控制信息和数据发往SPU染色处理单元(1)进行运算,并将结果存入SPU染色处理单元(1)的内部寄存器文件;
b.如果是加载或存储操作,则将控制信息和数据发往LSU加载存储单元(6)进行运算:
i.如果是局部加载,则LSU加载存储单元(6)依据控制信息和输入数据从SPU染色处理单元(1)的局部存储器加载信息,并将该信息写入SPU染色处理单元(1)的内部寄存器文件;
ii.如果是共享加载,则LSU加载存储单元(6)依据控制信息和输入数据从SSRAM单元(8)中加载信息,并将该信息写入SPU染色处理单元(1)的内部寄存器文件;
iii.如果是纹理加载,则LSU加载存储单元(6)依据控制信息和输入数据通过RAC单元(7)和接口c从外部加载信息,并将该信息写入SPU染色处理单元(1)的内部寄存器文件;
iv.如果是常量加载,则LSU加载存储单元(6)依据控制信息和输入数据从C$单元(5)加载信息,并将该信息写入SPU染色处理单元(1)的内部寄存器文件;
v.如果是局部存储,则LSU加载存储单元(6)依据控制信息和输入数据将SPU染色处理单元(1)内部寄存器文件中的信息存入SPU染色处理单元(1)内部的局部存储器;
vi.如果是共享存储,则LSU加载存储单元(6)依据控制信息和输入数据将SPU染色处理单元(1)内部寄存器中的信息通过RAC单元(7)存入SSRAM单元(8);
4)程序执行完毕后,CU控制单元产生完成信息,并通过接口d向外部报告所述完成信息;
5)外部模块检测到所述完成信息后通过接口c经RAC单元(7)将加工完成的数据从SPU染色处理单元(1)的局部存储器搬出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司西安航空计算技术研究所,未经中国航空工业集团公司西安航空计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611139607.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:反射体(新金辉)
- 下一篇:挡风圈(反射体‑金宝)