[发明专利]一种模型训练方法、装置、电子设备及存储介质在审
申请号: | 202010114079.6 | 申请日: | 2020-02-24 |
公开(公告)号: | CN111310684A | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 东声(苏州)智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 唐正瑜 |
地址: | 215000 江苏省苏州市工业*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 电子设备 存储 介质 | ||
本申请提供一种模型训练方法、装置、电子设备及存储介质,该方法包括:对预先训练的第一神经网络模型的网络结构进行优化,获得优化后的第二神经网络;通过推断加速引擎训练第二神经网络,获得第二神经网络模型。在上述的实现过程中,通过对预先训练的第一神经网络模型的网络结构进行优化,获得优化后的第二神经网络;通过推断加速引擎训练第二神经网络,获得第二神经网络模型;也就是说,通过结合对模型进行优化和使用推断加速引擎来减少对神经网络模型训练的时间,从而提高了对神经网络模型进行训练的速度,有效地改善了对神经网络模型进行训练的速度比较慢的问题。
技术领域
本申请涉及人工智能、深度学习和迁移学习的技术领域,具体而言,涉及一种模型训练方法、装置、电子设备及存储介质。
背景技术
迁移学习(transfer learning),是一种机器学习方法,就是指把为第一任务构建的模型作为初始模型,将该初始模型用在为第二任务构建模型的过程方法;迁移学习具体例如:用来辨识汽车的模型,该模型也可以被用来提升识别卡车的能力,即该模型已经获得了识别汽车的能力,只需对模型的神经网络结构稍微调整并训练,便可以将该模型用于识别卡车。
在目前的神经网络模型训练过程中,为了优化神经网络模型训练,通常使用迁移学习的方法来加快神经网络模型训练的速度,然而在具体的实践过程中发现,使用迁移学习方法针对神经网络层数很多的神经网络模型,或者需要训练的权重参数非常多的神经网络模型,对神经网络模型进行训练的速度比较慢。
发明内容
本申请实施例的目的在于提供一种模型训练方法、装置、电子设备及存储介质,用于改善对神经网络模型进行训练的速度比较慢的问题。
本申请实施例提供了一种模型训练方法,应用于电子设备,包括:对预先训练的第一神经网络模型的网络结构进行优化,获得优化后的第二神经网络;通过推断加速引擎训练第二神经网络,获得第二神经网络模型。在上述的实现过程中,通过对预先训练的第一神经网络模型的网络结构进行优化,获得优化后的第二神经网络;通过推断加速引擎训练第二神经网络,获得第二神经网络模型;也就是说,通过结合对模型进行优化和使用推断加速引擎来减少对神经网络模型训练的时间,从而提高了对神经网络模型进行训练的速度,有效地改善了对神经网络模型进行训练的速度比较慢的问题。
可选地,在本申请实施例中,网络结构包括:权重参数和神经网络层;对预先训练的第一神经网络模型的网络结构进行优化,包括:调整第一神经网络模型的网络结构中的权重参数;或者调整第一神经网络模型的网络结构中的神经网络层的数量。在上述的实现过程中,通过调整第一神经网络模型的网络结构中的权重参数;或者调整第一神经网络模型的网络结构中的神经网络层的数量;有效地优化了神经网络模型的网络结构,从而减少了对神经网络模型的训练参数或训练层数,提高了对神经网络模型进行训练的速度。
可选地,在本申请实施例中,通过推断加速引擎训练第二神经网络,获得第二神经网络模型,包括:获得多个训练数据和多个训练标签,训练标签是训练数据对应的数据标签;通过推断加速引擎使用多个训练数据和多个训练标签训练第二神经网络,获得第二神经网络模型。在上述的实现过程中,通过推断加速引擎使用多个训练数据和多个训练标签训练第二神经网络,获得第二神经网络模型;从而提高了对第二神经网络模型训练时的计算能力,提高了对神经网络模型进行训练的速度。
可选地,在本申请实施例中,通过推断加速引擎使用多个训练数据和多个训练标签训练第二神经网络,包括:安装电子设备的驱动程序和推断加速引擎的依赖环境;通过推断加速引擎使用多个训练数据和多个训练标签训练第二神经网络,获得第二神经网络模型。在上述的实现过程中,通过安装电子设备的驱动程序和推断加速引擎的依赖环境;通过推断加速引擎使用多个训练数据和多个训练标签训练第二神经网络,获得第二神经网络模型;从而提高了对第二神经网络模型训练时的计算能力,提高了对神经网络模型进行训练的速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东声(苏州)智能科技有限公司,未经东声(苏州)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010114079.6/2.html,转载请声明来源钻瓜专利网。