[发明专利]执行运算的方法、装置、芯片、设备、介质和程序产品在审
申请号: | 202110820258.6 | 申请日: | 2021-07-20 |
公开(公告)号: | CN113407351A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 徐英男;杜学亮 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N20/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 赵林琳 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 执行 运算 方法 装置 芯片 设备 介质 程序 产品 | ||
1.一种执行深度学习训练中的运算操作的方法,包括:
获取用于所述运算操作的指令,所述运算操作包括多个向量操作;
针对所述多个向量操作中的每个向量操作,确定用于比较的两个源操作数向量;以及
利用针对所述向量操作的指令格式,对所述两个源操作数向量执行所述向量操作,以得到包括目的操作数向量的运算结果。
2.根据权利要求1所述的方法,其中所述两个源操作数向量分别具有第一数量个元素,对所述两个源操作数向量执行所述向量操作包括:
对于所述两个源操作数向量中的每个元素,按照所述元素的数据类型并行地进行第二数量次逐元素比较运算,其中所述第一数量大于或者等于所述第二数量。
3.根据权利要求2所述的方法,还包括:
确定所述目的操作数向量中的相应元素的值。
4.根据权利要求1所述的方法,其中所述指令格式包括用于所述两个源操作数向量的域、用于所述目的操作数向量的域、用于数据类型的域、操作码域、和/或保留域。
5.根据权利要求4所述的方法,其中在所述操作码域中,操作码包括以下中的一项:比较对象是否小于另一对象;比较对象是否大于另一对象;以及比较对象是否等于另一对象。
6.根据权利要求4所述的方法,其中所述数据类型包括以下中的一项:浮点数、半浮点数、有符号整数、以及无符号整数。
7.根据权利要求1所述的方法,其中所述多个向量操作中的每个向量操作按照加载、ALU运算、存储的顺序被执行,所述多个向量操作中的相邻两个向量操作的所述执行是部分重叠的。
8.一种执行深度学习训练中的运算操作的装置,包括:
至少一个向量加速模块,所述至少一个向量加速模块包括:
获取模块,被配置为获取用于所述运算操作的指令,所述运算操作包括多个向量操作;
向量确定模块,被配置为针对所述多个向量操作中的每个向量操作,确定用于比较的两个源操作数向量;以及
向量计算模块,被配置为利用针对所述向量操作的指令格式来对所述两个源操作数向量执行所述向量操作,以得到包括目的操作数向量的运算结果。
9.根据权利要求8所述的装置,其中所述两个源操作数向量分别具有第一数量个元素,对所述两个源操作数向量执行所述向量操作包括:
对于所述两个源操作数向量中的每个元素,按照所述元素的相应数据类型并行地进行第二数量次逐元素比较运算,其中所述第一数量大于或者等于所述第二数量。
10.根据权利要求9所述的装置,对所述两个源操作数向量执行所述向量操作还包括:
确定所述目的操作数向量中的相应元素的值。
11.根据权利要求8所述的装置,其中所述指令格式包括用于所述两个源操作数向量的域、用于所述目的操作数向量的域、用于数据类型的域、操作码域、和/或保留域。
12.根据权利要求11所述的装置,其中在所述操作码域中,操作码包括以下中的一项:比较对象是否小于另一对象;比较对象是否大于另一对象;以及比较对象是否等于另一对象。
13.根据权利要求11所述的装置,其中所述目的操作数向量的所述数据类型包括以下中的一项:浮点数、半浮点数、有符号整数、以及无符号整数。
14.根据权利要求8所述的装置,其中所述多个向量操作中的每个向量操作按照加载、ALU运算、存储的顺序被执行,所述多个向量操作中的相邻两个向量操作的所述执行是部分重叠的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110820258.6/1.html,转载请声明来源钻瓜专利网。