[发明专利]图形处理器的硬件模拟方法和计算机可读存储介质在审
申请号: | 202210113252.X | 申请日: | 2022-01-30 |
公开(公告)号: | CN114416454A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海壁仞智能科技有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/26 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 彭久云 |
地址: | 201100 上海市闵行区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图形 处理器 硬件 模拟 方法 计算机 可读 存储 介质 | ||
1.一种图形处理器的硬件模拟方法,由处理单元执行,其特征在于,包括:
依据用户程序中所调用的程序语言接口中的相应于第二类型图形处理器中的硬件组件的函数和实际参数,以及依据所述用户程序中的相应于所述第二类型图形处理器中的硬件组件的数据结构和变量,通过现有GPU的编程接口引入相应于第一类型图形处理器的指令,用于使用所述第一类型图形处理器的硬件架构来模拟所述第二类型图形处理器中的所述硬件组件所要完成的指定功能,
其中,所述函数、所述数据结构以及所述变量原本用于驱动所述第二类型图形处理器中的所述硬件组件以完成指定功能。
2.如权利要求1所述的图形处理器的硬件模拟方法,其特征在于,包括:
编译相应于所述第一类型图形处理器的所述指令以生成二进制代码;以及
驱动所述第一类型图形处理器的硬件以执行所述二进制代码。
3.如权利要求2所述的图形处理器的硬件模拟方法,其特征在于,所述第一类型图形处理器的编译器编译相应于所述第一类型图形处理器的所述指令。
4.如权利要求3所述的图形处理器的硬件模拟方法,其特征在于,所述第一类型图形处理器的所述编译器无法编译所述用户程序中所调用的所述程序语言接口中的相应于所述第二类型图形处理器中的所述硬件组件的所述函数和所述实际参数,以及无法编译所述用户程序中的相应于所述第二类型图形处理器中的所述硬件组件的所述数据接口和所述变量。
5.如权利要求1所述的图形处理器的硬件模拟方法,其特征在于,所述第一类型图形处理器中没有设置所述硬件组件。
6.如权利要求1所述的图形处理器的硬件模拟方法,其特征在于,所述硬件组件包含运算核,所述运算核包含多个计算单元,每个所述计算单元包含一个通用共享存储器,每个所述通用共享存储器配置局部的空间让所属的所述计算单元中执行的所有线程都能够存取。
7.如权利要求6所述的图形处理器的硬件模拟方法,其特征在于,所述第一类型图形处理器包含计算单元,以及相应于所述第一类型图形处理器的所述指令包含以下操作,用于:将所述计算单元设置成使用固定数量的线程硬件来执行;将所述计算单元中的通用共享存储器分为四个不重叠的局部;以及设定所述计算单元中运行的每个线程在所述通用共享存储器的可视范围,用于限制每个线程只能存取所述通用共享存储器中的一个局部。
8.如权利要求1所述的图形处理器的硬件模拟方法,其特征在于,所述硬件组件包含运算核,所述运算核包含多个计算单元,每个所述计算单元包含归约计算硬件和归约缓存器。
9.如权利要求8所述的图形处理器的硬件模拟方法,其特征在于,所述第一类型图形处理器包含计算单元,以及相应于所述第一类型图形处理器的所述指令包含以下操作,用于:将所有线程分为多组;将所述计算单元中的通用共享存储器分为多个不重叠的区域,并且分别只允许指定组的所述线程能够进行存取;使用所述计算单元并行地执行多组所述线程的计算;以及合并每组所述线程的计算结果,其中,使用所述通用共享存储器中的相应区域存储一组所述线程的归约计算的临时性结果或者最终结果。
10.如权利要求1所述的图形处理器的硬件模拟方法,其特征在于,所述硬件组件包含张量核,所述张量核包含通用矩阵连乘单元、第一矩阵缓存器、第二矩阵缓存器和第三矩阵缓存器,以及所述通用矩阵连乘单元用于依据所述第一矩阵缓存器和所述第二矩阵缓存器中存储的两个矩阵进行矩阵连乘和累加,并且将计算结果存储至所述第三矩阵缓存器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海壁仞智能科技有限公司,未经上海壁仞智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210113252.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种磷酸铁制备方法、产品及系统
- 下一篇:一种改善导光板固定的车载背光模组