[发明专利]训练模型的方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202010607599.0 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111783872A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 付琰;陈亮辉;周洋杰;方军 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 模型 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请公开了一种训练模型的方法、装置、电子设备及计算机可读存储介质,涉及人工智能领域,具体涉及深度学习技术领域。具体实现方案为:获取样本数据集,并在该样本数据集中随机选取若干个样本数据作为子样本数据集;基于该子样本数据集对待训练模型进行训练,得到第一训练参数,以及第二训练参数的取值区间;基于上述样本数据集、第一训练参数、第二训练参数的取值区间,对待训练模型进行训练,得到第二训练参数与第三训练参数;将上述第一训练参数、第二训练参数及第三训练参数确定为待训练模型的模型参数。本申请可以有效缩短自动机器学习中参数调节过程所耗费的时长。
技术领域
本申请涉及人工智能领域,具体涉及深度学习技术领域。本申请提供了一种训练模型的方法、装置、电子设备及计算机可读存储介质。
背景技术
近年来,人工智能领域的机器学习技术已经在互联网点击预估、计算机视觉、语音识别、自动驾驶等越来越多的领域中开始发挥重要的作用。
自动机器学习通常分为机器学习和自动调参两部分。其中,机器学习部分用于使用样本数据对模型进行训练,自动调参部分用于在模型训练过程中基于一定的参数调整策略,对模型的参数进行调节,从而得出最优的模型结构。
深度学习是机器学习的一个分支,相比于其它机器学习模型,深度学习的模型复杂度比较高,且样本数据量越充足时,深度学习的效果往往更好。但是,样本数据量越大,自动机器学习中参数调节过程所耗费的时间也会越久。
发明内容
本申请提供了一种训练模型的方法、装置、电子设备及计算机可读存储介质。
根据本申请的第一方面,提供了一种训练模型的方法,包括:
获取样本数据集,并在所述样本数据集中随机选取若干个样本数据作为子样本数据集;
基于所述子样本数据集对待训练模型进行训练,得到第一训练参数,以及第二训练参数的取值区间;
基于所述样本数据集、所述第一训练参数、所述第二训练参数的取值区间,对所述待训练模型进行训练,得到第二训练参数与第三训练参数;
将所述第一训练参数、所述第二训练参数及所述第三训练参数确定为所述待训练模型的模型参数。
根据本申请的第二方面,提供了一种训练模型的装置,包括:
样本数据处理模块,用于获取样本数据集,并在所述样本数据集中随机选取若干个样本数据作为子样本数据集;
训练模块,用于基于所述子样本数据集对待训练模型进行训练,得到第一训练参数,以及第二训练参数的取值区间;
所述训练模块,还用于基于所述样本数据集、所述第一训练参数、所述第二训练参数的取值区间,对所述待训练模型进行训练,得到第二训练参数与第三训练参数;
所述训练模块,还用于将所述第一训练参数、所述第二训练参数及所述第三训练参数确定为所述待训练模型的模型参数。
根据本申请的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请的第一方面所提供的训练模型的方法。
根据本申请的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请的第一方面所提供的训练模型的方法。
根据本申请的技术解决了自动机器学习中参数调节过程所耗费的时间较久的技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010607599.0/2.html,转载请声明来源钻瓜专利网。