[发明专利]图像处理方法和装置、存储介质和电子设备有效
| 申请号: | 202010664687.4 | 申请日: | 2020-07-10 |
| 公开(公告)号: | CN111797266B | 公开(公告)日: | 2022-02-08 |
| 发明(设计)人: | 苏凯;王长虎 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
| 主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/532;G06F16/55 |
| 代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 王晓霞 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 处理 方法 装置 存储 介质 电子设备 | ||
1.一种图像处理方法,其特征在于,所述方法包括:
将待处理图像输入图像处理模型;
获取图像处理模型输出的检索标签和入库标签,其中,所述检索标签用于表征待处理图像中物体的类别,所述入库标签用于表征是否将所述待处理图像加入检索库中;
其中,所述图像处理模型包括用于输出检索标签的检索分支,和用于输出入库标签的入库分支,
所述检索分支,用于从所述待处理图像中提取第一检索特征,将所述第一检索特征和第二检索特征融合,得到最终检索特征,并基于所述最终检索特征输出所述检索标签;
所述入库分支,用于从所述待处理图像中提取第一入库特征,将所述第一入库特征和第二入库特征融合,得到最终入库特征,并基于所述最终入库特征输出所述入库标签;
其中,所述第二检索特征是由所述第一入库特征转换得到的,所述第二入库特征是由所述第一检索特征转换得到的。
2.根据权利要求1所述的方法,其特征在于,通过卷积函数和激活函数将所述第一入库特征转换为所述第二检索特征,并将所述第一检索特征转换为所述第二入库特征,其中,所述第二检索特征的维度比所述第一入库特征的维度低,所述第二入库特征的维度比所述第一检索特征的维度低。
3.根据权利要求1所述的图像处理方法,其特征在于,所述方法还包括:
基于所述检索标签,判断是否从所述检索库中查询与所述待处理图像特征匹配的目标图像和/或目标视频,和/或
基于所述入库标签,判断是否将所述待处理图像加入所述检索库中,并在确定将所述待处理图像加入检索库中的情况下,将所述待处理图像和/或提取到所述待处理图像的视频加入所述检索库中。
4.根据权利要求1所述的方法,其特征在于,所述图像处理模型是通过以下方式训练得到的:
将已标注检索标签和入库标签的样本图像集输入待训练的图像处理模型;
重复执行基于所述图像处理模型输出的检索标签和入库标签,以及样本图像的实际检索标签和实际入库标签,以及预设的损失函数,调整所述图像处理模型的所述检索分支和/或所述入库分支的参数的步骤,直至满足训练停止条件;
其中,所述预设的损失函数包括用于生成所述检索标签的损失值的第一损失函数,和用于生成所述入库标签的损失值的第二损失函数。
5.根据权利要求4所述的方法,其特征在于,所述检索标签包括表征物体为可检索的类别的第一类标签,所述入库标签包括表征图片为不可入库图片的第二类标签,
所述预设的损失函数还包括:
用于在所述检索分支输出的标签为所述第一类标签,且所述入库分支针对同一图片输出的标签为所述第二类标签时产生损失值的第三损失函数。
6.根据权利要求5所述的方法,其特征在于,所述基于所述图像处理模型输出的检索标签和入库标签,以及样本图像的实际检索标签和实际入库标签,以及预设的损失函数,调整所述图像处理模型的所述检索分支和/或所述入库分支的参数,包括:
通过第一损失函数,基于所述图像处理模型输出的检索标签和实际检索标签生成第一损失值;
通过第二损失函数,基于所述图像处理模型输出的入库标签和实际入库标签生成第二损失值;
通过第三损失函数,基于所述图像处理模型输出的检索标签和入库标签生成第三损失值;
基于所述第一损失值、第二损失值和第三损失值,生成最终损失值,并基于所述最终损失值调整所述图像处理模型的所述检索分支和/或所述入库分支的参数。
7.根据权利要求6所述的方法,其特征在于,所述基于所述第一损失值、第二损失值和第三损失值,生成最终损失值,包括:
通过下述方式生成最终损失值:
loss=L1×loss1+L2×loss2+loss3
其中,loss为所述最终损失值,loss1为所述第一损失值,loss2为所述第二损失值,loss3为所述第三损失值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010664687.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





