[发明专利]用于向量前导零、向量后导零、向量操作数1计数和向量奇偶性计算的功能单元有效
| 申请号: | 201180045389.6 | 申请日: | 2011-09-23 |
| 公开(公告)号: | CN103119578A | 公开(公告)日: | 2013-05-22 |
| 发明(设计)人: | J·维德迈尔;S·萨姆德腊拉;R·戈利韦尔;E·W·马胡林 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06F15/76 | 分类号: | G06F15/76;G06F7/00;G06F9/30 |
| 代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张晰;王英 |
| 地址: | 美国加*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 向量 前导 后导零 作数 计数 奇偶性 计算 功能 单元 | ||
技术领域
本发明的领域一般涉及计算机系统,并且更具体地涉及一种用于执行向量乘加指令以及使用用于计算向量乘加结果的逻辑块的其它指令的处理器体系结构。
背景技术
计算机科学领域广泛地认可两种类型的处理器体系结构,即“标量”和“向量”。标量处理器被设计成执行对单个数据集进行运算的指令,而向量处理器被设计成执行对多个数据集进行运算的指令。图1A和图1B呈现出演示标量处理器和向量处理器之间的基本差别的比较性示例。
图1A示出了标量“与”指令的示例,其中单个操作数集A和B“与”在一起以生成单数(singular)(或“标量”)结果C(即,AB=C)。作为对比,图1B示出了向量“与”指令的示例,其中两个操作数集A/B和D/E分别并行地“与”在一起以同时生成向量结果C、F(即,A“与”B=C且D“与”E=F)。
通常,本领域公知的是,两个输入操作数和输出结果存储在专用寄存器中。例如,许多指令将具有两个输入操作数。因此,将使用两个不同的输入寄存器来临时存储各输入操作数。而且,这些相同的指令将生成输出值,该输出值临时存储在第三(结果)寄存器中。在图1A和图1B中观察到各个输入寄存器101a、101b和102a、102b以及结果寄存器103a、103b。明显地,能够容易地辨别出“标量”对“向量”的特性。
也就是说,观察到图1A的标量设计输入寄存器101a和102a仅保持标量值(分别为A和B)。同样,也观察到图1A的标量设计的结果寄存器103a仅保持标量值(C)。作为对比,观察到图1B的向量系统的输入寄存器101b和102b保持向量(寄存器101b中的A、D以及寄存器102b中的B、E)。同样,也观察到图1B的向量系统的结果寄存器103b保持向量值(C、F)。从术语上讲,图1B的向量系统的寄存器101b、102b和103b中的每个的内容能够统称为“向量”,并且向量内的各个单个的标量值能够称为“元素”。因此,观察到例如寄存器101b存储有“向量”A、D,其由“元素”A和“元素”D构成。
已知的是仅标量或SIMD乘运算已经实际上在半导体芯片处理器中实现为单个处理器指令。已知已经在半导体芯片处理器中实现的标量或SIMD乘指令包括:“乘”指令(MUL),其提供两个整数输入操作数的乘积的较低阶位;以及“乘高(multiply high)”指令(MULH),其提供标量整数乘运算的较高阶位。
已知在半导体处理器芯片中实现为标量或SIMD指令的其它指令包括“计数前导零”CLZ指令、“计数后导零”指令CTZ和“计数”指令CNT。标量CLZ指令接受标量输入A并且返回A中的在A中的最高阶1之前的0的数量(例如,如果A=1000,则CLZ的结果=0;如果A=0100,则CLZ的结果=1;如果A=0010,则CLZ的结果=2;等等)。标量CTZ指令接受标量输入A并且返回A中的在A中最低阶1之后的0的数量(例如,如果A=1000,则CTZ的结果=3;如果A=0100,则CTZ的结果=2;如果A=0010,则CTZ的结果=1,等等)。标量CNT指令接受标量输入A并且返回A中的1的数量(例如,如果A=1011,则CLZ的结果=3;如果A=1001,则CLZ的结果=2;如果A=0010,则CLZ的结果=1,等等)。
附图说明
在随附附图中的各图中,通过示例而不是限制的方式阐述了本发明,其中相似的附图标记表示相似的元件,并且其中:
图1a和1b示出了标量逻辑运算和向量逻辑运算;
图2示出了向量乘加功能单元;
图3示出了能够用于图2的功能单元200_1至200_N中的每个的电子功能单元的实施例;
图4a示出了向量浮点乘加运算;
图4b示出了向量整数浮点运算;
图5示出了图3的功能单元的实施例,该功能单元具有执行前导零、后导零、操作数1计数及奇偶性指令的扩展逻辑;
图6a至6d示出了下列指令的执行,分别为:前导零确定、后导零确定、操作数1计数以及操作数奇偶性确定;
图7示出了半导体处理器的图;
图8示出了计算系统的图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180045389.6/2.html,转载请声明来源钻瓜专利网。





