[发明专利]用于点积操作的系统、方法和装置有效
| 申请号: | 201780086894.2 | 申请日: | 2017-07-01 |
| 公开(公告)号: | CN110337635B | 公开(公告)日: | 2023-09-19 |
| 发明(设计)人: | R·凡伦天;D·鲍姆;Z·斯波伯;J·考博尔;E·乌尔德-阿迈德-瓦尔;B·L·托尔;M·J·查尼;M·阿德尔曼;B·泽维;A·海内克;S·卢巴诺维奇 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06F9/30 | 分类号: | G06F9/30 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 李炜;黄嵩泉 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 操作 系统 方法 装置 | ||
1.一种处理器,包括:
解码电路,用于对指令解码,所述指令具有用于第一源矩阵操作数、第二源矩阵操作数和目的地矩阵操作数的字段,其中,所述第一源矩阵操作数、所述第二源矩阵操作数和所述目的地矩阵操作数中的每一个都包括数据元素的多个矩阵;以及
执行电路,用于执行经解码的指令以:
通过对来自所述第一源矩阵操作数和所述第二源矩阵操作数的元素执行点积操作来计算结果,以及
将所述结果累加到所述目的地矩阵操作数的数据元素位置中。
2.如权利要求1所述的处理器,其中,所述第一源矩阵操作数和所述第二源矩阵操作数的元素是有符号字元素,并且其中,所述目的地矩阵操作数的元素是有符号双字。
3.如权利要求1所述的处理器,其中,所述第一源矩阵操作数和所述第二源矩阵操作数的元素是有符号字尺寸的元素,并且其中,所述目的地矩阵操作数的元素是有符号四字尺寸的元素。
4.如权利要求1所述的处理器,其中,所述第一源矩阵操作数和所述第二源矩阵操作数的元素是字节尺寸的元素,并且其中,所述目的地矩阵操作数的元素是双字尺寸的元素。
5.如权利要求1所述的处理器,其中,所述第一源矩阵操作数的元素是字节尺寸的元素且所述第二源矩阵操作数的元素是4位尺寸的元素,并且其中,所述目的地矩阵的元素是双字尺寸的元素。
6.如权利要求1所述的处理器,其中,所述第一源矩阵操作数的元素和所述第二源矩阵操作数的元素是4位尺寸的元素,并且其中,所述目的地矩阵的元素是双字尺寸的元素。
7.如权利要求1所述的处理器,其中,所述结果是利用饱和计算出的。
8.如权利要求1所述的处理器,其中,所述执行电路包括多个融合乘法加法器。
9.如权利要求1所述的处理器,其中,所述指令指示所述第一源矩阵操作数和所述第二源矩阵操作数中的至少一者包含无符号数据值。
10.如权利要求1所述的处理器,其中,当所述第一源矩阵操作数具有的列数与所述第二源矩阵操作数具有的行数不同时,错误被生成。
11.如权利要求1所述的处理器,其中,当所述目的地矩阵操作数的行数与所述第一源矩阵操作数的行数不同时,错误被生成。
12.如权利要求1所述的处理器,其中,当所述目的地矩阵操作数的列数与所述第二源矩阵操作数的列数不同时,错误被生成。
13.一种用于计算机处理器的方法,包括:
对指令解码,所述指令具有用于第一源矩阵操作数、第二源矩阵操作数和目的地矩阵操作数的字段,其中,所述第一源矩阵操作数、所述第二源矩阵操作数和所述目的地矩阵操作数中的每一个都包括数据元素的多个矩阵;以及
执行经解码的指令以:
通过对来自所述第一源矩阵操作数和所述第二源矩阵操作数的元素执行点积操作来计算结果,以及
将所述结果累加到所述目的地矩阵操作数的数据元素位置中。
14.如权利要求13所述的方法,其中,所述第一源矩阵操作数和所述第二源矩阵操作数的元素是有符号字元素,并且其中,所述目的地矩阵操作数的元素是有符号双字。
15.如权利要求13所述的方法,其中,所述第一源矩阵操作数和所述第二源矩阵操作数的元素是有符号字尺寸的元素,并且其中,所述目的地矩阵操作数的元素是有符号四字尺寸的元素。
16.如权利要求13所述的方法,其中,所述第一源矩阵操作数和所述第二源矩阵操作数的元素是字节尺寸的元素,并且其中,所述目的地矩阵操作数的元素是双字尺寸的元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780086894.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据存储方法及设备
- 下一篇:数据转换方法和装置





