[发明专利]融合语义和图像特征的智能训练方法、装置、设备及介质有效
申请号: | 202111008010.6 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113449821B | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 周迪;曹广;徐爱华;徐伟强;王勋;章坚武;张健;贺建飙;王建新;郭春生;吴震东;林江;陈玲江;陈芳妮 | 申请(专利权)人: | 浙江宇视科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 刘臣刚 |
地址: | 310051 浙江省杭州市滨江区西兴街道江陵路*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 语义 图像 特征 智能 训练 方法 装置 设备 介质 | ||
本发明实施例公开了一种融合语义和图像特征的智能训练方法、装置、设备及介质。所述方法包括:对训练样本的类别硬标签信息自然语言处理,生成对应的类别软标签信息,以及将训练样本送入图像分类模型中卷积神经网络层与全连接层处理,经过激励函数激活得到训练样本对应的各类别预测概率,进而依据训练样本对应的类别软标签信息与对应的各类别预测概率,对卷积神经网络层与全连接层的参数进行调整更新。采用本申请方案,能够在图像分类任务中使用类别中的自然语言信息自适应地生成更为平滑的标签,将融入了语义的软标签与预测概率结合进行参数更新,同时使用融合自然语言信息和图像信息的新模式进行模型更新,能够较好地提升模型的鲁棒性。
技术领域
本发明实施例涉及深度学习技术领域,尤其涉及一种融合语义和图像特征的智能训练方法、装置、设备及介质。
背景技术
深度学习在目标物体识别、目标检测、实例分割等任务上均能够获得良好效果。然而,在样本量稀少的时候,基于常规深度学习算法的模型训练容易过拟合,这不利于模型发挥出应有的性能。
相关方案中,在模型训练时,通过引入数据增强和标签平滑的方式加以改进,增加模型鲁棒性。但是,数据增强需手工设计选择不同数据增强方式,并且导致训练时间增加;常用标签平滑对其他类别一视同仁,没有考虑不同类别间的差异性,甚至有些需要给定物体标定框,对数据集要求较高。因此,在数据量有限情况下如何提升模型的鲁棒性变得尤为重要。
发明内容
本发明实施例中提供了一种融合语义和图像特征的智能训练方法、装置、设备及介质,以实现将语义信息整合进标签使标签平滑化来进行模型训练。
第一方面,本发明实施例中提供了一种融合语义和图像特征的智能训练方法,所述方法包括:
对训练样本的类别硬标签信息自然语言处理,生成对应的类别软标签信息;
将训练样本送入图像分类模型中卷积神经网络层与全连接层处理,经过激励函数激活得到训练样本对应的各类别预测概率;
依据训练样本对应的类别软标签信息与对应的各类别预测概率,对所述卷积神经网络层与全连接层的参数进行调整更新,得到新的图像分类模型。
第二方面,本发明实施例中还提供了一种融合语义和图像特征的智能训练装置,所述装置包括:
软标签生成模块,用于对训练样本的类别硬标签信息自然语言处理,生成对应的类别软标签信息;
分类预测模块,用于将训练样本送入图像分类模型中卷积神经网络层与全连接层处理,经过激励函数激活得到训练样本对应的各类别预测概率;
模型参数更新模块,用于依据训练样本对应的类别软标签信息与对应的各类别预测概率,对所述卷积神经网络层与全连接层的参数进行调整更新,得到新的图像分类模型。
第三方面,本发明实施例中还提供了一种电子设备,包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现如本发明任意实施例中提供的所述融合语义和图像特征的智能训练方法。
第四方面,本发明实施例中还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理装置执行时实现如本发明任意实施例中提供的所述融合语义和图像特征的智能训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江宇视科技有限公司,未经浙江宇视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111008010.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新能源汽车
- 下一篇:一种纺机配件的收件机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序