[发明专利]模型训练方法、装置、电子设备、存储介质及程序产品有效
申请号: | 202110730081.0 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113361721B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 刘吉;周晨娣;窦德景;贾俊铖 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N20/20 | 分类号: | G06N20/20;G06F9/48;G06F9/50 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张芳;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 电子设备 存储 介质 程序 产品 | ||
1.一种模型训练方法,所述方法包括:
针对多个全局模型中目标全局模型的一轮训练,根据训练各个全局模型所需要的时间,从多个终端设备中选择至少两个目标终端设备;
将所述目标全局模型的全局模型参数发送给所述至少两个目标终端设备;
接收所述至少两个目标终端设备发送的本地模型参数,并根据所述至少两个目标终端设备发送的本地模型参数,更新所述目标全局模型参数,所述本地模型参数为所述至少两个目标终端设备各自根据本地训练样本对所述目标全局模型进行训练得到的;
其中,所述根据训练各个全局模型所需要的时间,从多个终端设备中选择至少两个目标终端设备,包括:
获取各终端设备当前的资源状态;根据所述各终端设备当前的资源状态,确定训练各个全局模型所需要的时间;根据训练所述各个全局模型所需要的时间,从所述多个终端设备中选择至少两个目标终端设备;
其中,所述根据训练所述各个全局模型所需要的时间,从所述多个终端设备中选择至少两个目标终端设备,包括:
计算所述目标全局模型的本地训练样本类别的波动值;根据训练所述各个全局模型所需要的时间,计算设备样本训练所有全局模型所需要的时间,并确定所述波动值和所述设备样本训练所有全局模型所需要的时间的和值;所述设备样本包括用于训练各全局模型的终端设备;将所述设备样本以及与所述设备样本对应的和值添加到观测集合中,并采用所述观测集合对初始随机森林模型进行训练,得到第一随机森林模型;再次从所述多个终端设备中获取新的设备样本,并根据所述新的设备样本和所述第一随机森林模型,确定所述至少两个目标终端设备。
2.根据权利要求1所述的方法,其中,所述根据所述新的设备样本和所述第一随机森林模型,确定所述至少两个目标终端设备,包括:
将所述新的设备样本输入所述第一随机森林模型中,得到预测值,根据所述预测值的方差和均值计算采集函数,将所述新的设备样本中采集函数的值最小的第一设备样本以及与所述第一设备样本对应的和值添加到所述观测集合中,得到新的观测集合;采用所述新的观测集合对所述第一随机森林模型进行训练,得到第二随机森林模型,再次获取新的设备样本,并将所述第二随机森林模型作为新的第一随机森林模型,重复执行此步骤,直至执行次数达到预设值;
从新的观测集合中确定所述至少两个目标终端设备。
3.根据权利要求2所述的方法,其中,所述从新的观测集合中确定所述至少两个目标终端设备,包括:
从所述新的观测集合中,确定和值最小的目标设备样本;
从所述目标设备样本中确定所述目标全局模型对应的所述至少两个目标终端设备。
4.根据权利要求1-3任一项所述的方法,所述计算所述目标全局模型的本地训练样本类别的波动值,包括:
获取各个终端设备训练所述目标全局模型所使用的本地训练样本的类别;
确定各所述类别的本地训练样本的数量;
根据所述类别和所述数量,确定所述波动值。
5.根据权利要求1-3任一项所述的方法,所述根据训练各个全局模型所需要的时间,从所述多个终端设备中选择至少两个目标终端设备之前,所述方法还包括:
确定所述多个终端设备中每个终端设备参与训练所述目标全局模型的次数是否大于预设值;
若存在第一终端设备参与训练所述目标全局模型的次数大于所述预设值,则将所述第一终端设备从所述多个终端设备中剔除;
所述根据训练各个全局模型所需要的时间,从所述多个终端设备中选择至少两个目标终端设备,包括:
根据训练各个全局模型所需要的时间,从剔除所述第一终端设备后的多个终端设备中选择所述至少两个目标终端设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110730081.0/1.html,转载请声明来源钻瓜专利网。