[发明专利]参数配置模型的训练方法、参数配置方法和参数配置设备有效
| 申请号: | 202111096849.X | 申请日: | 2021-09-18 |
| 公开(公告)号: | CN113568659B | 公开(公告)日: | 2022-02-08 |
| 发明(设计)人: | 艾国;郭海丰;杨作兴 | 申请(专利权)人: | 深圳比特微电子科技有限公司 |
| 主分类号: | G06F8/71 | 分类号: | G06F8/71;G06N20/00;G06N3/08 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 於菪珉 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 参数 配置 模型 训练 方法 设备 | ||
1.一种用于数据处理设备的参数配置模型的训练方法,其特征在于,所述数据处理设备包括多个算力板,每个算力板包括呈阵列排布的多个计算芯片,所述训练方法包括:
获取所述数据处理设备的训练样本集,其中,所述训练样本集包括运行参数和与运行参数一一对应的效益参数,运行参数包括全局运行参数和与位置分布相关联的局域运行参数,每个全局参数矩阵被用来表示仅一种全局运行参数,每个局域参数矩阵被用来表示仅一个算力板上的仅一种芯片运行参数,该局域参数矩阵中每个矩阵元分别具有与所述一个算力板上对应位置处的一个或多个计算芯片的所述一种芯片运行参数相关联的取值,效益参数被配置为反映所述数据处理设备的功耗算力比;
基于所述训练样本集对参数配置模型进行训练,其中,运行参数被配置为作为参数配置模型的输入,并且效益参数被配置为作为参数配置模型的输出;以及
当参数配置模型的训练准确率大于或等于第一预设准确率时,结束训练并获得所训练的参数配置模型。
2.如权利要求1所述的训练方法,其特征在于,同一个全局参数矩阵中的每个矩阵元具有与相应的全局运行参数相关联的、相同的取值。
3.如权利要求2所述的训练方法,其特征在于,运行参数包括第一通道数目的全局参数矩阵,其中,第一通道数目等于全局运行参数的第一种类数目。
4.如权利要求2所述的训练方法,其特征在于,全局运行参数包括所述数据处理设备的整体工作频率、整体运行温度、整体工作电压和散热参数,以及环境温度中的至少一者。
5.如权利要求1所述的训练方法,其特征在于,所述数据处理设备包括第一数目的算力板,运行参数包括第二通道数目的局域参数矩阵,其中,第二通道数目等于局域运行参数的第二种类数目与所述第一数目的乘积。
6.如权利要求1所述的训练方法,其特征在于,芯片运行参数包括芯片工作频率、芯片运行温度和芯片工作电压中的至少一者。
7.如权利要求1所述的训练方法,其特征在于,效益参数包括所述数据处理设备的功耗和算力;或者
效益参数包括所述数据处理设备的功耗算力比。
8.如权利要求1所述的训练方法,其特征在于,根据卷积神经网络基于所述训练样本集对参数配置模型进行训练。
9.如权利要求1所述的训练方法,其特征在于,基于所述训练样本集对参数配置模型进行训练包括:
针对所述训练样本集中的每组运行参数和对应的效益参数,分别执行以下操作:
基于参数配置模型中的一个或多个隐含层,逐步对运行参数进行运算,以产生输出效益参数;
比较所产生的输出效益参数以及与所述运行参数对应的效益参数,以产生输出偏差;
根据训练样本集中的所有运行参数和对应的效益参数的组的输出偏差,确定参数配置模型的训练准确率;以及
当训练准确率小于第一预设准确率时,调整参数配置模型中的模型参数,直至参数配置模型的训练准确率大于或等于第一预设准确率。
10.如权利要求9所述的训练方法,其特征在于,基于所述训练样本集对参数配置模型进行训练还包括:
在基于参数配置模型中的一个或多个隐含层,逐步对运行参数进行运算之前,对运行参数中的全局运行参数和局域运行参数中的至少一者进行归一化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳比特微电子科技有限公司,未经深圳比特微电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111096849.X/1.html,转载请声明来源钻瓜专利网。





