[发明专利]数据中心数据分析类基准测试程序的应用选取方法及系统有效
申请号: | 201310131986.1 | 申请日: | 2013-04-16 |
公开(公告)号: | CN103257923A | 公开(公告)日: | 2013-08-21 |
发明(设计)人: | 贾禛;杜翠兰;周润林;王磊;刘文宝;詹剑锋;张立新 | 申请(专利权)人: | 中国科学院计算技术研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;田景宜 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据中心 数据 分析 基准 测试 程序 应用 选取 方法 系统 | ||
1.一种数据中心数据分析类基准测试程序的应用选取方法,执行于数据中心计算机系统中,其特征在于,包括:
步骤一,从多种应用领域中分别选取至少一个应用,组成应用集,该应用集覆盖了特定种类的编程模型;
步骤二,运行该应用集中的所有应用,针对每个应用,都分别获取预定性能指标的参数值;
步骤三,将各个应用所对应的该参数值分别组成一个特征向量,对所有特征向量进行聚类;
步骤四,在聚类得到的每个类中,选择距离类中心点最近和最远的两个应用作为基准测试程序的应用进行基准测试。
2.如权利要求1所述的方法,其特征在于,该多种应用领域包括:基本操作、数据挖掘算法、数据仓库操作、生物信息学和音视频处理。
3.如权利要求1所述的方法,其特征在于,该特定种类的编程模型包括:
MapReduce、MPI、Workqueu和All-pairs。
4.如权利要求1所述的方法,其特征在于,该预定性能指标包括:
程序指令集特性、CPU利用率、指令集并行度、访存数据、磁盘读写数据和传输数据包数据中的一种或多种。
5.如权利要求1所述的方法,其特征在于,步骤三的该聚类采用自适应K-means算法。
6.如权利要求4所述的方法,其特征在于,步骤二进一步包括:
通过读取硬件性能计数器获得运行的各种指令的数量以得到该程序指令集特性,该程序指令集特性为运行的各种指令的比例,该指令包括:装载指令、存储指令、浮点操作指令、分支指令和整形操作指令中的任意一种或多种;
通过读取硬件性能计数器获取该访存数据,该访存数据包括一级指令缓存缺失率、二级数据缓存缺失率和二级缓存缺失率;
通过读取磁盘状态文件获得该磁盘读写数据,该磁盘读写数据分别包括磁盘每秒读取和写入的数据量;
通过读取网络参数文件获得该传输数据包数据,该传输数据包数据包括每秒收发的数据包总量。
7.一种数据中心数据分析类基准测试程序的应用选取系统,设置于数据中心计算机系统中,其特征在于,包括:
应用选择装置,从多种应用领域中分别选取至少一个应用,组成应用集,该应用集覆盖了特定种类的编程模型;
参数获取装置,运行该应用集中的所有应用,针对每个应用,都分别获取预定性能指标的参数值;
聚类装置,将各个应用所对应的该参数值分别组成一个特征向量,对所有特征向量进行聚类;
类别选择装置,在聚类得到的每个类中,选择距离类中心点最近和最远的两个应用作为基准测试程序的应用进行基准测试。
8.如权利要求7所述的系统,其特征在于,该多种应用领域包括:基本操作、数据挖掘算法、数据仓库操作、生物信息学和音视频处理。
9.如权利要求7所述的系统,其特征在于,该特定种类的编程模型包括:
MapReduce、MPI、Workqueu和All-pairs。
10.如权利要求7所述的系统,其特征在于,该预定性能指标包括:
程序指令集特性、CPU利用率、指令集并行度、访存数据、磁盘读写数据和传输数据包数据中的一种或多种。
11.如权利要求7所述的系统,其特征在于,该聚类装置采用自适应K-means算法。
12.如权利要求10所述的方法,其特征在于,参数获取装置进一步包括:
程序指令集特性获取单元,通过读取硬件性能计数器获得运行的各种指令的数量以得到该程序指令集特性,该程序指令集特性为运行的各种指令的比例,该指令包括:装载指令、存储指令、浮点操作指令、分支指令和整形操作指令中的任意一种或多种;
访存数据获取单元,通过读取硬件性能计数器获取该访存数据,该访存数据包括一级指令缓存缺失率、二级数据缓存缺失率和二级缓存缺失率;
磁盘读写数据获取单元,通过读取磁盘状态文件获得该磁盘读写数据,该磁盘读写数据分别包括磁盘每秒读取和写入的数据量;
传输数据包数据获取单元,通过读取网络参数文件获得该传输数据包数据,该传输数据包数据包括每秒收发的数据包总量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所;国家计算机网络与信息安全管理中心,未经中国科学院计算技术研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310131986.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置