[发明专利]基于机器学习的预取能效优化自适应装置及方法有效
申请号: | 201610236148.4 | 申请日: | 2016-04-16 |
公开(公告)号: | CN105955709B | 公开(公告)日: | 2018-02-27 |
发明(设计)人: | 刘鹏;周英 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06N99/00 |
代理公司: | 杭州中成专利事务所有限公司33212 | 代理人: | 金祺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 能效 优化 自适应 装置 方法 | ||
1.基于机器学习的预取能效优化自适应方法,其特征是包括以下步骤:
1)、离线训练学习模型:通过收集不同应用程序在不同预取配置下运行收集到的硬件计数器信息及最佳的预取配置对机器学习算法实现的学习模型训练,该步骤具体包括以下步骤:
1.1)提取程序特征:处理器核(1)、一级高速缓存单元(2)及二级高速缓存单元(3)的访问信息传递给硬件计数器统计模块(7),特征提取模块(9)从硬件计数器统计模块(7)提取访问高速缓存信息作为应用程序在运行时的存储访问行为及预取相关行为信息,作为程序特征观测量;
1.2)构建训练数据集:根据程序特征提取的结果,选择与预取能效最相关的特征及达到最大能效时预取的配置,作为一个有效数据;
1.3)训练学习模型:给定程序的特征观测量及对应的最优预取配置作为模型的输入,采用机器学习的算法训练学习模型(10);
2)、动态预测预取配置:学习模型(10)根据新的应用程序运行时处理器核(1)、一级高速缓存单元(2)及二级高速缓存单元(3)传递给硬件计数器统计模块(7)的访存信息经特征提取模块(9)处理后传递给学习模型(10),学习模型(10)处理后将分类结果传递给特殊目的寄存器(11),特殊目的寄存器(11)控制一级数据预取装置(5)和二级数据预取装置(6)的预取距离和深度,从而实时预测预取的配置最大化能效。
2.根据权利要求1所述的基于机器学习的预取能效优化自适应方法,其特征是:所述步骤1.1)中程序的特征观测量通过特征提取模块(9)从硬件计数器统计模块(7)获取,硬件计数器统计模块(7)从一级高速缓存单元(2)、二级高速缓存单元(3)、一级数据预取装置(5)和二级数据预取装置(6)获取;
统计结果包括处理器核(1)中每周期执行指令数、一级高速缓存单元(2)和二级高速缓存单元(3)中的读写指令队列的占有数、读指令数目、读指令缺失数目、高速缓存的缺失次数、高速缓存的替换次数、高速缓存的写回次数、转换旁路缓冲器缺失次数、高速缓存数据预取次数、高速缓存数据预取准确数据次数、数据预取导致高速缓存污染次数、预取引起的高速缓存替换次数。
3.根据权利要求2所述的基于机器学习的预取能效优化自适应方法,其特征是:
所述步骤1.2)中构建训练数据集包括以下步骤:
1.2.1、程序特征片段模拟点采样:选择能代表程序访存行为的特征片段;
1.2.2、对特征片段分别采用不同预取方式进行模拟,获取不同预取方式下的程序特征观测量;
1.2.3、数据标记:对于每个特征片段标记类别即选择最优预取配置,每条有效数据由程序特征观测量及最优预取配置构成。
4.根据权利要求3所述的基于机器学习的预取能效优化自适应方法,其特征是:
步骤1.2.3中最优预取配置即最大化能效依据,包括:
相近的性能下,选择功耗消耗最低的配置,功耗消耗最低的标准是引起高速缓存的数据污染、总线带宽增加最少以及预取单元的硬件开销少;
性能提升不大,则关闭预取。
5.根据权利要求3所述的基于机器学习的预取能效优化自适应方法,其特征是:
所述步骤1.3)中训练学习模型(10),学习模型(10)采用机器学习的算法进行实现然后采用训练数据集对学习模型(10)进行线下训练;该学习模型(10)输入为各程序的特征观测量,输出为最优预取配置类别;预取配置的类别包括关闭预取、开启预取时不同的预取方式的深度和距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610236148.4/1.html,转载请声明来源钻瓜专利网。