[发明专利]模型训练方法、装置及系统在审
| 申请号: | 201910878280.9 | 申请日: | 2019-09-17 |
| 公开(公告)号: | CN112529204A | 公开(公告)日: | 2021-03-19 |
| 发明(设计)人: | 薛莉;张彦芳;张浩;张亮;李扬 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 颜晶 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 装置 系统 | ||
1.一种模型训练方法,其特征在于,应用于局点分析设备,包括:
接收第一分析设备发送的机器学习模型;
基于第一训练样本集合,对所述机器学习模型进行增量训练,所述第一训练样本集合中的特征数据是所述局点分析设备所对应的局点网络的特征数据。
2.根据权利要求1所述的方法,其特征在于,在所述接收第一分析设备发送的机器学习模型之后,所述方法还包括:
采用所述机器学习模型进行分类结果的预测;
向所述评估设备发送预测信息,所述预测信息包括预测得到的分类结果,以供所述评估设备基于所述预测信息评估所述机器学习模型是否发生劣化;
所述基于第一训练样本集合,对所述机器学习模型进行增量训练,包括:
在接收到所述评估设备发送的训练指令后,基于所述第一训练样本集合,对所述机器学习模型进行增量训练,所述训练指令用于指示对所述机器学习模型进行训练。
3.根据权利要求2所述的方法,其特征在于,所述机器学习模型用于对一个或多个关键绩效指标KPI特征数据组成的待预测数据进行分类结果的预测;所述KPI特征数据为KPI时间序列的特征数据,或者为KPI数据;
所述预测信息还包括所述待预测数据中的KPI特征数据对应的KPI类别,所述待预测数据所属的设备的标识以及所述待预测数据对应的KPI数据的采集时刻。
4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
当增量训练后的机器学习模型的性能不满足性能达标条件时,向所述第一分析设备发送重训练请求,所述重训练请求用于请求所述第一分析设备对所述机器学习模型进行重训练。
5.根据权利要求1至4任一所述的方法,其特征在于,所述机器学习模型为树模型,所述基于第一训练样本集合,对所述机器学习模型进行增量训练,包括:
对于所述第一训练样本集合中的任一训练样本,从所述机器学习模型的根节点开始遍历,执行如下遍历过程:
当遍历到的第一节点的当前分裂成本小于第一节点的历史分裂成本时,添加关联的第二节点,所述第一节点为所述机器学习模型中的任一非叶子节点,所述第二节点为所述第一节点的父节点或子节点;
当第一节点的当前分裂成本不小于第一节点的历史分裂成本,遍历所述第一节点的子树中的节点,并将遍历到的节点确定为新的第一节点,再次执行所述遍历过程,直至遍历到的第一节点的当前分裂成本小于第一节点的历史分裂成本,或者遍历到目标深度;
其中,第一节点的当前分裂成本为所述第一节点基于第一训练样本进行节点分裂的成本,所述第一训练样本为所述第一训练样本集合中的任一训练样本,所述第一训练样本包括一个或多个特征维度的特征数据,所述特征数据为数值数据,所述第一节点的历史分裂成本为所述第一节点基于所述第一节点的历史训练样本集合进行节点分裂的成本,所述第一节点的历史训练样本集合为所述机器学习模型的历史训练样本集合中划分至所述第一节点的样本的集合。
6.根据权利要求5所述的方法,其特征在于,所述第一节点的当前分裂成本与第一数值分布范围的大小负相关,所述第一数值分布范围是基于所述第一训练样本中的特征取值与第二数值分布范围确定的分布范围;所述第二数值分布范围为第一节点的历史训练样本集合中的特征取值的分布范围,所述第一节点的历史分裂成本与所述第二数值分布范围的大小负相关。
7.根据权利要求6所述的方法,其特征在于,所述第一节点的当前分裂成本为所述第一数值分布范围中各特征维度上的特征取值的跨度之和的倒数,所述第一节点的历史分裂成本为所述第二数值分布范围中各特征维度上的特征取值的跨度之和的倒数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910878280.9/1.html,转载请声明来源钻瓜专利网。





