[发明专利]模型处理方法、装置、电子设备以及存储介质在审
| 申请号: | 202210233983.8 | 申请日: | 2022-03-09 |
| 公开(公告)号: | CN114595833A | 公开(公告)日: | 2022-06-07 |
| 发明(设计)人: | 叶柏威 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 宫传芝 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 处理 方法 装置 电子设备 以及 存储 介质 | ||
1.一种模型处理方法,其中,包括:
获取至少一个模型训练任务,其中,所述至少一个模型训练任务中每个模型训练任务至少包括训练数据和任务标识;
基于每个模型训练任务的任务标识确定与该模型训练任务对应的待训练模型;
基于每个模型训练任务的训练数据和该模型训练任务对应的模型训练方式对该模型训练任务对应的待训练模型进行训练,得到目标模型。
2.根据权利要求1所述的方法,其中,所述待训练模型包括:至少一个子模型,在获取所述至少一个模型训练任务之后,所述方法还包括:
接收所述至少一个模型训练任务中每个模型训练任务对应的模型训练方式,其中,所述模型训练方式用于确定所述待训练模型的所述至少一个子模型中待训练的子模型和/或确定所述待训练的子模型中需要更新模型参数的子模型。
3.根据权利要求2所述的方法,其中,基于每个模型训练任务的任务标识确定与该模型训练任务对应的待训练模型,包括:
基于每个模型训练任务的任务标识确定与该模型训练任务对应的场景子模型,其中,所述场景子模型用于表示能够实现该模型训练任务对应的场景的子模型;
基于所述场景子模型和预设子模型构建所述待训练模型。
4.根据权利要求3所述的方法,其中,
不同模型训练任务对应的场景子模型不同,不同模型训练任务对应的预设子模型相同。
5.根据权利要求3或4所述的方法,其中,基于每个模型训练任务的训练数据和该模型训练任务对应的模型训练方式对该模型训练任务对应的待训练模型进行训练,得到目标模型,包括:
响应于该模型训练任务对应的模型训练方式为第一训练方式,利用该模型训练任务的训练数据对该模型训练任务对应的待训练模型中的所述场景子模型和所述预设子模型进行训练,基于训练结果更新所述场景子模型的模型参数。
6.根据权利要求3或4所述的方法,其中,基于每个模型训练任务的训练数据和该模型训练任务对应的模型训练方式对该模型训练任务对应的待训练模型进行训练,得到目标模型,包括:
响应于该模型训练任务对应的模型训练方式为第二训练方式,利用该模型训练任务的训练数据对该模型训练任务对应的待训练模型中的所述场景子模型和所述预设子模型进行训练,基于训练结果更新所述场景子模型的模型参数和所述预设子模型的模型参数。
7.根据权利要求3或4所述的方法,其中,基于每个模型训练任务的训练数据和该模型训练任务对应的模型训练方式对该模型训练任务对应的待训练模型进行训练,得到目标模型,包括:
响应于该模型训练任务对应的模型训练方式为第三训练方式,利用该模型训练任务的训练数据对该模型训练任务对应的待训练模型中的所述场景子模型进行训练,基于训练结果更新所述场景子模型的模型参数。
8.根据权利要求3或4所述的方法,其中,基于所述场景子模型和预设子模型构建所述待训练模型,包括:
获取所述预设子模型的输出端与所述场景子模型的输入端之间的插拔状态;
基于所述插拔状态、所述场景子模型和所述预设子模型生成所述待训练模型,其中,所述插拔状态用于表示所述场景子模型的输入端是否连接于所述预设子模型的输出端。
9.根据权利要求8所述的方法,其中,基于所述插拔状态、所述场景子模型和所述预设子模型生成所述待训练模型,包括:
响应于所述插拔状态为所述场景子模型的输入端连接于所述预设子模型的输出端,基于所述场景子模型和所述预设子模型生成所述待训练模型;
响应于所述插拔状态为所述场景子模型的输入端未连接于所述预设子模型的输出端,基于所述场景子模型生成所述待训练模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210233983.8/1.html,转载请声明来源钻瓜专利网。





