[发明专利]一种模型训练方法、装置、电子设备及存储介质在审

申请号：	202010114079.6	申请日：	2020-02-24
公开（公告）号：	CN111310684A	公开（公告）日：	2020-06-19
发明（设计）人：	不公告发明人	申请（专利权）人：	东声(苏州)智能科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	唐正瑜
地址：	215000 江苏省苏州市工业***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种模型训练方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种模型训练方法、装置、电子设备及存储介质，该方法包括：对预先训练的第一神经网络模型的网络结构进行优化，获得优化后的第二神经网络；通过推断加速引擎训练第二神经网络，获得第二神经网络模型。在上述的实现过程中，通过对预先训练的第一神经网络模型的网络结构进行优化，获得优化后的第二神经网络；通过推断加速引擎训练第二神经网络，获得第二神经网络模型；也就是说，通过结合对模型进行优化和使用推断加速引擎来减少对神经网络模型训练的时间，从而提高了对神经网络模型进行训练的速度，有效地改善了对神经网络模型进行训练的速度比较慢的问题。

技术领域

本申请涉及人工智能、深度学习和迁移学习的技术领域，具体而言，涉及一种模型训练方法、装置、电子设备及存储介质。

背景技术

迁移学习(transfer learning)，是一种机器学习方法，就是指把为第一任务构建的模型作为初始模型，将该初始模型用在为第二任务构建模型的过程方法；迁移学习具体例如：用来辨识汽车的模型，该模型也可以被用来提升识别卡车的能力，即该模型已经获得了识别汽车的能力，只需对模型的神经网络结构稍微调整并训练，便可以将该模型用于识别卡车。

在目前的神经网络模型训练过程中，为了优化神经网络模型训练，通常使用迁移学习的方法来加快神经网络模型训练的速度，然而在具体的实践过程中发现，使用迁移学习方法针对神经网络层数很多的神经网络模型，或者需要训练的权重参数非常多的神经网络模型，对神经网络模型进行训练的速度比较慢。

发明内容

本申请实施例的目的在于提供一种模型训练方法、装置、电子设备及存储介质，用于改善对神经网络模型进行训练的速度比较慢的问题。

本申请实施例提供了一种模型训练方法，应用于电子设备，包括：对预先训练的第一神经网络模型的网络结构进行优化，获得优化后的第二神经网络；通过推断加速引擎训练第二神经网络，获得第二神经网络模型。在上述的实现过程中，通过对预先训练的第一神经网络模型的网络结构进行优化，获得优化后的第二神经网络；通过推断加速引擎训练第二神经网络，获得第二神经网络模型；也就是说，通过结合对模型进行优化和使用推断加速引擎来减少对神经网络模型训练的时间，从而提高了对神经网络模型进行训练的速度，有效地改善了对神经网络模型进行训练的速度比较慢的问题。

可选地，在本申请实施例中，网络结构包括：权重参数和神经网络层；对预先训练的第一神经网络模型的网络结构进行优化，包括：调整第一神经网络模型的网络结构中的权重参数；或者调整第一神经网络模型的网络结构中的神经网络层的数量。在上述的实现过程中，通过调整第一神经网络模型的网络结构中的权重参数；或者调整第一神经网络模型的网络结构中的神经网络层的数量；有效地优化了神经网络模型的网络结构，从而减少了对神经网络模型的训练参数或训练层数，提高了对神经网络模型进行训练的速度。

可选地，在本申请实施例中，通过推断加速引擎训练第二神经网络，获得第二神经网络模型，包括：获得多个训练数据和多个训练标签，训练标签是训练数据对应的数据标签；通过推断加速引擎使用多个训练数据和多个训练标签训练第二神经网络，获得第二神经网络模型。在上述的实现过程中，通过推断加速引擎使用多个训练数据和多个训练标签训练第二神经网络，获得第二神经网络模型；从而提高了对第二神经网络模型训练时的计算能力，提高了对神经网络模型进行训练的速度。

可选地，在本申请实施例中，通过推断加速引擎使用多个训练数据和多个训练标签训练第二神经网络，包括：安装电子设备的驱动程序和推断加速引擎的依赖环境；通过推断加速引擎使用多个训练数据和多个训练标签训练第二神经网络，获得第二神经网络模型。在上述的实现过程中，通过安装电子设备的驱动程序和推断加速引擎的依赖环境；通过推断加速引擎使用多个训练数据和多个训练标签训练第二神经网络，获得第二神经网络模型；从而提高了对第二神经网络模型训练时的计算能力，提高了对神经网络模型进行训练的速度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东声(苏州)智能科技有限公司，未经东声(苏州)智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010114079.6/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于泛在物联网的华灯常备电源系统及监测方法
下一篇：整体式超塑成形和扩散结合夹层结构以及推进系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种模型训练方法、装置、电子设备及存储介质在审

专利文献下载