[发明专利]基于线程相似性的调度线程执行有效
| 申请号: | 201180074891.X | 申请日: | 2011-11-15 |
| 公开(公告)号: | CN104040500B | 公开(公告)日: | 2018-03-30 |
| 发明(设计)人: | F·陈;Y·郝;J·付 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06F9/46 | 分类号: | G06F9/46 |
| 代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 杨美灵,马永利 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 线程 相似性 调度 执行 | ||
技术领域
本申请一般涉及通用图形处理单元。
背景技术
在许多计算平台中,可使用分离的中央处理和图形处理单元。图形处理任务可从中央处理器卸载到图形处理器。图形处理器可执行多种专用任务,包括图形任务和财务分析任务。典型的在涉及大量数学操作时,任务可卸载到图形处理器。
例如,在财务分析中可执行蒙特卡罗模拟。蒙特卡罗模拟基于平均价格和股票价格的变化预测可选价格。图形处理器可用于使用数千个线程进行这些模拟。通常线程执行的顺序未被优化,只是简单地以一个线程接着一个的顺序执行。
发明内容
按照本公开的一方面,提供一种方法,包括:分割重复的图形处理任务为多个步骤;执行跨多个所述重复的任务的相同步骤;识别任务间的相似性;并且排序执行所述任务的线程以利用任务间的相似性。
按照本公开的另一方面,提供一种装置,包括:用于分割重复的图形处理任务为多个步骤的部件;用于执行跨多个所述重复的任务的相同步骤的部件;用于识别任务间的相似性的部件;以及用于排序执行所述任务的线程以利用任务间的相似性的部件。
按照本公开的又一方面,提供一种设备,包括:控制器,分割重复的图形处理任务为多个步骤,执行跨多个所述重复的任务的相同步骤,识别任务间的相似性,并且排序执行所述任务的线程以利用任务间的相似性;以及耦合到所述控制器的存储器。
附图说明
图1是根据一实施例的图形处理单元体系结构的描绘;
图2是图1实施例中使用的相似性历史缓冲器的示意描绘;
图3是与图1实施例联系使用的相似性采样表的示意描绘;
图4是相似性跟踪缓冲器的更详细描绘;
图5是根据一实施例的相似性检测的状态图;
图6是根据一实施例的相似性采样的示意描绘;
图7根据一实施例的相似性采样的流程图;
图8是根据一实施例的相似性采样状态的描绘;
图9是根据一实施例的相似性历史缓冲器更新的描绘;
图10是根据一实施例的相似性历史更新的流程图;
图11是根据一实施例的相似性信息输出的示意描述;
图12是根据一实施例的相似性信息输出的流程图。
具体实施方式
根据一些实施例,图形处理单元中执行的线程间的空间和时间局部性(locality)可被分析和跟踪以提高性能。一些应用中,大量线程被执行并且那些线程使用公用资源,例如公用数据,相似性跟踪可用于通过降低高速缓存未命中(miss)率提高性能以及更有效地使用相对小型高速缓存。
一些实施例中,任务可被分割为大量步骤,并且任务可以因为多种不同情况而重复。通过计算跨多种情形的相同步骤(其每个都被不同线程组执行),该线程组间的相似性可用于提高性能。
一种可用的相似性分析应用是使用上千个线程用于蒙特卡罗模拟的图形处理。大量的线程,例如128或256个线程,可被用于计算每个股票的可选价格。可分析大量选项,例如可同时计算10,000个可选价格。然而,不同选项可使用提供随机数的相同的状态输入。因此可实现基于相似性的性能改进的机会,因为不同组的线程可共享公用资源的使用,在这种情况下为状态输入。由于图形处理单元的高速缓存大小与中央处理单元的相比相对较小,所以相似性分析特别应服从提高图形单元的性能。
因此,代替一个选项接着一个地计算股票可选价格,可选价格可通过将计算分割为多个步骤并跨多个选项执行一个步骤来计算。一个接着一个地计算可选价格可能低效,因为两组线程可访问相同数据集。因此通过使用线程组间的局部性识别和利用,当将计算分割为多个步骤且对于大量选项计算相同步骤时性能可被提高。
更特别的,线程执行顺序可重新排序或重新调度以利用线程间局部性。再次回顾蒙特卡罗模拟的例子,模拟计算可分割为大概一百个步骤。作为一个示例,可为第一选项完成第一步骤,且之后计算可暂停,接下来通过为第二选线完成第一步骤,且之后将其暂停等等。这样可降低高速缓存中的信息量从而空间局部性可有利地跨线程组使用。
从而在一些实施例中的高速缓存未命中率会降低。因此通过识别跨线程组的局部性,通过调度线程执行顺序以利用线程组间的局部性可获得性能的益处。基本上,具有局部性的线程组可顺序执行。
相同的局部性优势会产生在多个图形处理任务中,包括那些一般与像素着色器(shader)相关的,因为它们在计算的不同部分要求不同的纹理资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180074891.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种堆垛式锂电池系统
- 下一篇:一种包装秤自动采样机构





