[发明专利]存储有程序的机器可读介质、计算机系统和一种操作方法在审
申请号: | 202210624232.9 | 申请日: | 2022-06-02 |
公开(公告)号: | CN115016953A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海壁仞智能科技有限公司 |
主分类号: | G06F9/52 | 分类号: | G06F9/52;G06F9/30;G06F9/54 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 彭久云 |
地址: | 201100 上海市闵行区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储 程序 机器 可读 介质 计算机系统 一种 操作方法 | ||
本发明提供一种存储有程序的机器可读介质、计算机系统及其执行单元的操作方法。所述机器可读介质存储的程序在被执行时,使得数据处理集成电路的一个执行单元执行多个线程组中的第一线程组以及第二线程组。这些线程组包括存在依赖关系且通过同一个指令屏障绑定在一起的数据提供指令与数据取用指令。在数据提供指令被执行时,指令屏障的计数值被对应调整。当数据取用指令作为目前待执行指令时,指令屏障的计数值被对应调整。数据取用指令被暂停执行,直到指令屏障的计数值已表示“多个相关联指令中的所有数据提供指令皆已被执行,以及这些相关联指令中的所有数据取用指令皆已作为目前待执行指令”。
技术领域
本发明涉及一种计算机系统,且特别涉及一种存储有程序的机器可读介质、计算机系统及其执行单元(executionunit)的操作方法。
背景技术
诸如中央处理器(central processing unit,CPU)、图形处理器(graphicsprocessing unit,GPU)、通用计算型GPU(general-purpose computing on GPU,GPGPU)等数据处理集成电路,其可以执行程序(program)而完成诸如卷积神经网络(ConvolutionalNeural Network,CNN)运算、人工智能(artificial intelligence)运算等各种功能。一般而言,程序包括多个工作组(workgroup),每一个工作组包括多个线程组(warp),而每一个线程组包括多个线程(thread)。同一个工作组中的线程可以按照调度单位分组,然后一组一组地调度至硬件去执行。这个调度单位称作线程组。
一般而言,GPU包括多个计算单元(computing unit,CU),而每一个计算单元(computing unit,CU)包括多个执行单元(executionunit,EU)。一个执行单元可以执行多个线程组。如何安排在同一个执行单元中不同线程组之间的数据同步机制是计算机系统领域的诸多技术课题之一。举例来说,在一个生产者线程组(producerwarp)中的一个矩阵加载指令(数据提供指令)可以提供矩阵数据至在执行单元中的寄存器堆(register file),而在一个消费者线程组(consumerwarp)中的一个矩阵乘算指令(数据取用指令)可以从寄存器堆取用矩阵加载指令所提供的矩阵数据。数据同步机制可以保证在矩阵加载指令将矩阵数据加载至寄存器堆后矩阵乘算指令才去寄存器堆取用矩阵数据。如何安排不同线程组之间的数据同步机制来降低数据同步的延迟(latency),是计算机系统领域的诸多技术课题之一。
发明内容
本发明提供一种存储有程序的机器可读介质、计算机系统及其执行单元的操作方法,以实现在同一个执行单元(execution unit,EU)中不同线程组(warp)之间的数据同步机制。
在根据本发明的实施例中,所述机器可读介质存储的程序在被执行时,使得数据处理集成电路的一个执行单元:执行多个线程组中的第一线程组以及第二线程组。所述多个线程组包括存在依赖关系的多个相关联指令。所述多个相关联指令通过同一个指令屏障(instruction barrier)绑定在一起。第一线程组包括所述多个相关联指令中的一个第一数据提供指令。第一数据提供指令用以提供数据至存储空间。在第一数据提供指令被执行时,指令屏障的计数值被对应调整以表示“所述多个相关联指令中的第一数据提供指令已被执行”。第二线程组包括所述多个相关联指令中的一个第一数据取用指令。当第一数据取用指令作为目前待执行指令时,指令屏障的计数值被对应调整以表示“所述多个相关联指令中的第一数据取用指令已作为目前待执行指令”。第一数据取用指令被暂停执行,直到指令屏障的计数值已表示“所述多个相关联指令中的所有数据提供指令皆已被执行,以及所述多个相关联指令中的所有数据取用指令皆已作为目前待执行指令”。当第一数据取用指令被执行时,第一数据取用指令从存储空间取用所述多个相关联指令所提供的数据。当指令屏障的计数值已表示“所述多个相关联指令中的所有数据提供指令皆已被执行,以及所述多个相关联指令中的所有数据取用指令皆已作为目前待执行指令”时,指令屏障的计数值被重置为初始值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海壁仞智能科技有限公司,未经上海壁仞智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210624232.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交互式同音异义词消歧方法、系统、电子设备和存储介质
- 下一篇:防尘真空阀