[发明专利]融合语义和图像特征的智能训练方法、装置、设备及介质有效
申请号: | 202111008010.6 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113449821B | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 周迪;曹广;徐爱华;徐伟强;王勋;章坚武;张健;贺建飙;王建新;郭春生;吴震东;林江;陈玲江;陈芳妮 | 申请(专利权)人: | 浙江宇视科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 刘臣刚 |
地址: | 310051 浙江省杭州市滨江区西兴街道江陵路*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 语义 图像 特征 智能 训练 方法 装置 设备 介质 | ||
1.一种融合语义和图像特征的智能训练方法,其特征在于,包括:
确定当前训练使用的软标签适配信息;所述软标签适配信息预先记录有类别硬标签信息所对应的融合有该类别硬标签所蕴含的语义内容信息以及类别硬标签信息对应的独热编码标签矩阵信息的类别软标签信息;
将训练样本的类别硬标签信息作为索引,通过查询软标签适配信息确定训练样本的类别硬标签信息对应的类别软标签信息;
将训练样本送入图像分类模型中卷积神经网络处理,得到训练样本对应的各类别预测概率;
依据训练样本对应的类别软标签信息与对应的各类别预测概率,对所述卷积神经网络的参数进行调整更新,得到新的图像分类模型;
其中,确定当前训练使用的软标签适配信息,包括:提取所述图像分类模型中卷积神经网络的全连接层的权值参数,得到权值矩阵;将所述全连接层中偏置项在行数维持不变的情况下沿矩阵列方向拼接至权值矩阵末尾,得到权值与偏置项对应的拼接矩阵;对所述权值与偏置项对应的拼接矩阵进行转换,得到第二临时软标签矩阵;将第二临时软标签矩阵与初始化生成的软标签适配信息或者上一次迭代更新生成的软标签适配信息进行融合,得到当前训练使用的软标签适配信息。
2.根据权利要求1所述的方法,其特征在于,所述类别硬标签信息包括类别名称信息、类别描述文本信息和/或类别属性信息。
3.根据权利要求1所述的方法,其特征在于,确定当前训练使用的软标签适配信息,包括:
将训练集内出现的单词构成的类别硬标签信息作为输入,通过至少一种自然语言词向量模型查找类别硬标签在对应自然语言词向量模型下的词向量矩阵;
对所述类别硬标签信息在至少一种自然语言词向量模型下的词向量矩阵分别进行转换,得到在至少一种自然语言词向量模型下的第一临时软标签矩阵;
将在至少一种自然语言词向量模型下的第一临时软标签矩阵与类别硬标签信息对应的独热编码标签矩阵进行融合,得到当前训练使用的软标签适配信息。
4.根据权利要求1所述的方法,其特征在于,依据训练样本对应的类别软标签信息与对应的各类别预测概率,对所述卷积神经网络的参数进行调整更新,包括:
依据训练样本对应的类别软标签与对应的各类别预测概率,通过进行交叉熵计算得到所述图像分类模型的损失函数值;
依据所述图像分类模型的损失函数值,利用梯度下降法对所述卷积神经网络的卷积层与全连接层的参数进行调整更新。
5.根据权利要求4所述的方法,其特征在于,所述图像分类模型的损失函数值计算公式包括以下:
其中,表示第i个训练样本的第j个类别的预测概率,表示第i个训练样本的第j个类别的类别软标签取值,p表示训练样本的个数,T表示训练样本的类别数。
6.一种融合语义和图像特征的智能训练装置,其特征在于,包括:
软标签生成模块,用于确定当前训练使用的软标签适配信息;其中所述软标签适配信息预先记录有类别硬标签信息所对应的融合有该类别硬标签所蕴含的语义内容信息以及类别硬标签信息对应的独热编码标签矩阵信息的类别软标签信息;以及,将训练样本的类别硬标签信息作为索引,通过查询软标签适配信息确定训练样本的类别硬标签信息对应的类别软标签信息;
分类预测模块,用于将训练样本送入图像分类模型中卷积神经网络处理,得到训练样本对应的各类别预测概率;
模型参数更新模块,用于依据训练样本对应的类别软标签信息与对应的各类别预测概率,对所述卷积神经网络的参数进行调整更新,得到新的图像分类模型;
其中,确定当前训练使用的软标签适配信息,包括:提取所述图像分类模型中卷积神经网络的全连接层的权值参数,得到权值矩阵;将所述全连接层中偏置项在行数维持不变的情况下沿矩阵列方向拼接至权值矩阵末尾,得到权值与偏置项对应的拼接矩阵;对所述权值与偏置项对应的拼接矩阵进行转换,得到第二临时软标签矩阵;将第二临时软标签矩阵与初始化生成的软标签适配信息或者上一次迭代更新生成的软标签适配信息进行融合,得到当前训练使用的软标签适配信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江宇视科技有限公司,未经浙江宇视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111008010.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新能源汽车
- 下一篇:一种纺机配件的收件机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序