[发明专利]神经网络模型的训练方法、装置、图像分类方法和介质有效
| 申请号: | 202011546849.0 | 申请日: | 2020-12-24 |
| 公开(公告)号: | CN112614571B | 公开(公告)日: | 2023-08-18 |
| 发明(设计)人: | 贾富仓;夏彤 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
| 主分类号: | G16H30/40 | 分类号: | G16H30/40;G06V20/40;G06V10/764;G06V10/774;G06V10/82;G06N3/0442;G06N3/08 |
| 代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
| 地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 模型 训练 方法 装置 图像 分类 介质 | ||
本申请公开了一种神经网络模型的训练方法、装置、图像分类方法和介质。该方法包括如下步骤获取标注有标签的多组图像序列,标签包括具有映射关系的第一类标签和第二类标签,第一类标签的时间粒度大于第二类标签;利用初始的神经网络模型对每一组图像序列进行标签分类,得到对每一组图像序列预测的第一类标签和第二类标签;基于图像序列标注的第一类标签、第二类标签和预测的第一类标签和第二类标签计算初始神经网络模型的总损失函数;收敛总损失函数,以得到训练后的神经网络模型。通过上述方式,本申请能够训练出更精确的神经网络模型。
技术领域
本申请涉及深度学习领域,特别是涉及一种神经网络模型的训练方法、神经网络模型的训练装置、图像分类方法和计算机可读存储介质。
背景技术
随着移动互联网与硬件处理器技术的不断发展,海量数据处理与计算能力不断提高,深度学习备受关注。卷积神经网络Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)等经典神经网络模型被相继提出。
CNN通过其特有的权值共享机制输入是空间上的变化,即以图像为典型例子的空间域数据表现非常好,但对于样本序列出现的时间顺序上的变化,即时间域数据无法建模。RNN正是针对时域序列数据提出的,其特殊的网络结构使神经元的输出可以在下一个时间点作为输入直接作用到本身,实现网络的输出为该时刻的输入与历史所有时刻共同作用的结果,达到对序列建模的目的。长短时记忆神经网络(Long Short-term Memory Networks,LSTM)是一种RNN特殊的类型,可以学习长期依赖信息。常见的时间序列数据包括:语言模型、手写体识别、序列生成、机器翻译、语音、视频分析等。
以视频分析为例,相关技术中通常使用CNN-LSTM模型范式对图像序列进行分类。然而,当图像序列帧间差异有限、存在干扰时,CNN-LSTM模型无法对抗图像序列的时空不一致的问题,进而影响模型精度。
发明内容
本申请提供一种神经网络模型的训练方法、神经网络模型的训练装置、图像分类方法和计算机可读存储介质,以解决相关技术中神经网络模型对图像序列的识别存在时空不一致的技术问题。
为解决上述技术问题,本申请提供一种神经网络模型的训练方法,该训练方法包括:获取标注有标签的多组图像序列,标签包括具有映射关系的第一类标签和第二类标签,第一类标签的时间粒度大于第二类标签;利用初始的神经网络模型对每一组图像序列进行标签分类,得到对每一组图像序列预测的第一类标签和第二类标签;基于图像序列标注的第一类标签、第二类标签和预测的第一类标签和第二类标签计算初始神经网络模型的总损失函数;收敛总损失函数,以得到训练后的神经网络模型。
为解决上述技术问题,本申请提供一种图像分类方法,该分类方法包括:获取图像序列,图像序列包括至少两帧图像;将图像序列输入神经网络模型,得到图像的标签;其中,标签包括具有映射关系的第一类标签和第二类标签,第一类标签的时间粒度大于第二类标签;神经网络模型为上述的神经网络模型的训练方法得到的训练后的神经网络模型。
为解决上述技术问题,本申请提供一种神经网络模型的训练装置。该训练装置包括处理器和存储器,处理器耦接存储器,在工作时执行指令,以配合存储器实现上述的神经网络模型的训练方法。
为解决上述技术问题,本申请提供一种计算机可读存储介质。计算机可读存储介质存储有计算机程序,计算机程序能够被处理器执行以实现上述的神经网络模型的训练方法或上述的图像序列的分类方法。
本申请通过利用神经网络模型对图像序列进行两种时间粒度上的分类预测,并根据预测的第一类标签和第二类标签与标注的第一类标签和第二类标签计算模型的总损失函数,基于两个时间粒度层面上对神经网络模型进行约束,以训练出能够改善对图像序列识别出现的时空不一致性的问题。
附图说明
图1是本申请提供的神经网络模型的训练方法第一实施例的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011546849.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无线降尘风门控制系统
- 下一篇:一种抗压防渗漏幕墙





