[发明专利]指令性能分析的方法和设备在审
申请号: | 201310533727.1 | 申请日: | 2013-10-31 |
公开(公告)号: | CN104598201A | 公开(公告)日: | 2015-05-06 |
发明(设计)人: | 梁祺;刘峰;陈沁悦;李盼;唐星 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指令 性能 分析 方法 设备 | ||
技术领域
本发明涉及计算机技术,更具体地说,涉及指令性能分析的方法和设备。
背景技术
流水线技术是当今处理器普遍采用的技术。图2A示出了传统的流水线。如图2A所示,第一条指令经过取指(Instruction Fetch,IF)阶段后,进入指令解码(Instruction Decode,ID)阶段;此时第二条指令进入取指阶段。第一条指令进入执行(Execute,EX)阶段时,第二条指令进入指令解码阶段,第三条指令进入取指阶段。以此类推,当第一条指令经过内存访问(MEMory access,MEM)阶段,进入寄存器写回(register Write Back,WB)阶段时,第二条指令处于内存访问阶段,第三条指令处于执行阶段,第四条指令处于指令解码阶段,第五条指令处于取指阶段。由此可见,通过流水线技术,可以并行地处理处于不同阶段的指令,从而提高了指令处理的速度。
随着CPU技术的发展,出现了所谓的超标量(super-scalar)处理器。超标量处理器指的是具有超标量流水线的处理器。由于处理器中的功能单元(Functional Unit)有许多种类,例如算术逻辑单元ALU、位移单元、乘法器等等,因此满足某些条件的指令可以在同一时间段分别利用这些不同种类的功能单元。相应地,可以将满足条件的多条指令分组合成指令分组,其中一条指令分组中最多包括的指令数称为指令分组条数。同一指令分组中的多条指令同时被发射(issue)到超标量处理器进行处理。当指令分组中的所有指令被处理完毕后,该指令分组被处理完毕。超标量处理器以指令分组为单位进行流水线操作。图2B示出超标量流水线。如图2B所示,当第一指令分组处于寄存器写回阶段时,第二指令分组处于内存访问阶段,第三指令分组处于执行阶段,第四指令分组处于指令解码阶段,第五指令分组处于取指阶段。
由于超标量处理器中是以指令分组为单位进行流水线操作,而不是像传统处理器那样以指令为单位进行流水线操作,因此针对超标量处理器进行指令性能分析,与针对传统处理器的指令性能分析存在很大不同。相应地,需要针对超标量处理器设计专门的指令性能分析方案。
发明内容
本发明实施例提供了指令性能分析的方法和设备。
根据本发明实施例的一种指令性能分析的方法,包括:获取在各采样时刻,与处理器的程序计数器所指示的指令对应的指令分组信息,其中所述指令分组信息指的是,在该采样时刻程序计数器所指示的指令所在的指令分组包括的指令数目;针对目标指令,根据所述指令分组信息,计算该目标指令的指令分组信息分布,其中该指令分组信息分布指的是该目标指令所对应的指令分组信息的统计分布;根据目标指令的指令分组信息分布,计算该目标指令的CPU指数对与该目标指令属于同一指令分组的其他指令的CPU指数的贡献,其中指令的CPU指数表示指令对CPU的占用量;和根据所述贡献修正与所述目标指令属于同一指令分组的其他指令的CPU指数。
根据本发明实施例的一种指令性能分析的设备,包括:指令分组信息获取装置,配置为获取在各采样时刻,与处理器的程序计数器所指示的指令对应的指令分组信息,其中所述指令分组信息指的是,在该采样时刻程序计数器所指示的指令所在的指令分组包括的指令数目;指令分组信息分布计算装置,配置为针对目标指令,根据所述指令分组信息,计算该目标指令的指令分组信息分布,其中该指令分组信息分布指的是该目标指令所对应的指令分组信息的统计分布;贡献计算装置,配置为根据目标指令的指令分组信息分布,计算该目标指令的CPU指数对与该目标指令属于同一指令分组的其他指令的CPU指数的贡献,其中指令的CPU指数表示指令对CPU的占用量;和修正装置,配置为根据所述贡献修正与所述目标指令属于同一指令分组的其他指令的CPU指数。
采用根据本发明实施例的方案,可以在以超标量处理器为指令处理平台时,提高指令性能分析的准确度。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1是适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图;
图2A是传统流水线的示意图,图2B是超标量流水线的示意图;
图3示出根据本发明实施例的采样分析的结果的一部分;
图4是根据本发明实施例的进行指令性能分析的方法的流程图;
图5示出根据本发明实施例得到的目标指令的统计组信息分布;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司;,未经国际商业机器公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310533727.1/2.html,转载请声明来源钻瓜专利网。