[发明专利]一种图像分类模型训练的方法、图像处理的方法及装置有效
| 申请号: | 201910233985.5 | 申请日: | 2019-03-26 |
| 公开(公告)号: | CN109784424B | 公开(公告)日: | 2021-02-09 |
| 发明(设计)人: | 揭泽群 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图像 分类 模型 训练 方法 处理 装置 | ||
本申请公开了一种图像分类模型训练的方法,包括:获取待训练图像;当固定待训练偏移量网络的第一模型参数时,通过待训练图像分类网络获取待训练图像的第一预测类别标注信息;根据图像内容类别信息以及第一预测类别标注信息,采用分类损失函数确定第二模型参数;当固定待训练图像分类网络的第二模型参数时,通过待训练偏移量网络获取待训练图像的第二预测类别标注信息;根据图像内容类别信息以及第二预测类别标注信息,采用分类损失函数确定第三模型参数;根据第二模型参数与第三模型参数得到图像语义分割网络模型。本申请还公开一种图像处理的方法及装置。本申请无需人工进行像素级别标注,从而减少人工标注成本,进而提升了模型训练的效率。
技术领域
本申请涉及人工智能领域,尤其涉及一种图像分类模型训练的方法、图像处理的方法及装置。
背景技术
图像语义分割是图像理解的基石性技术,在自动驾驶系统(比如街景识别与理解)、无人机应用(比如对着陆点判断)以及穿戴式设备应用中都起着举足轻重的左右。图像是由许多像素组成的,而语义分割就是将像素按照图像中表达语义含义的不同进行分割,使得机器自动分割并识别出图像中的内容。
目前,通常训练一个深度卷积神经网络来实现全图分类,再根据该深度卷积神经网络定位待训练图像中所对应图像内容区域,然后利用这些经过全图分类标注的图像内容区域作为分割的监督信息,最后训练得到图像语义分割网络模型。
然而,在训练图像语义分割网络模型时,所使用的待训练图像往往需要经过像素级标注。以分辨率为1024×2048的待训练图像为例,人工进行像素级别标注一张该分辨率大小的图像通常需要1.5小时,由此导致人工标注成本过高,且导致模型训练效率较低。
发明内容
本申请实施例提供了一种图像分类模型训练的方法、图像处理的方法及装置,可以对标注为图像级别的待训练图像进行训练,在保证图像语义分割网络模型性能的情况下,无需人工进行像素级别标注,从而减少了人工标注成本,进而提升了模型训练的效率。
有鉴于此,本申请第一方面提供一种图像分类模型训练的方法,包括:
获取待训练图像,其中,所述待训练图像具有类别标注信息,所述类别标注信息用于表示所述待训练图像中存在的图像内容类别信息;
当固定待训练偏移量网络的第一模型参数时,通过待训练图像分类网络获取所述待训练图像的第一预测类别标注信息,其中,所述待训练偏移量网络用于根据偏移变量对图像进行分类,所述待训练图像分类网络用于对图像中的图像内容进行分类;
根据所述图像内容类别信息以及所述第一预测类别标注信息,采用分类损失函数确定所述待训练图像分类网络所对应的第二模型参数;
当固定所述待训练图像分类网络的所述第二模型参数时,通过所述待训练偏移量网络获取所述待训练图像的第二预测类别标注信息;
根据所述图像内容类别信息以及所述第二预测类别标注信息,采用所述分类损失函数确定所述待训练偏移量网络所对应的第三模型参数;
根据所述第二模型参数与所述第三模型参数,对待训练图像语义分割网络模型进行训练,得到图像语义分割网络模型,其中,所述图像语义分割网络模型用于确定待处理图像的语义分割结果。
本申请第二方面提供一种图像处理的方法,包括:
获取待处理图像;
通过图像语义分割网络模型获取所述待处理图像的语义分割结果,其中,所述图像语义分割网络模型为根据待训练图像分类网络以及待训练偏移量网络交替训练得到的,所述待训练偏移量网络用于根据偏移变量对图像进行分类,所述待训练图像分类网络用于对图像中的图像内容进行分类;
根据所述语义分割结果对所述待处理图像进行处理。
本申请第三方面提供一种模型训练装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910233985.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





