[发明专利]图像处理方法、装置、系统和存储介质有效
| 申请号: | 201910859964.4 | 申请日: | 2019-09-11 |
| 公开(公告)号: | CN110728188B | 公开(公告)日: | 2022-12-02 |
| 发明(设计)人: | 李亮亮 | 申请(专利权)人: | 北京迈格威科技有限公司 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/774;G06V10/764;G06V10/82;G06N3/08 |
| 代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 李晴 |
| 地址: | 100190 北京市海淀区科*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 处理 方法 装置 系统 存储 介质 | ||
1.一种图像处理方法,其特征在于,所述图像处理方法包括:
获取包含目标对象的第一类型的图像;
将所述第一类型的图像输入神经网络模型,所述神经网络模型包括类型变换模块和识别模块;以及
利用所述类型变换模块对所述第一类型的图像进行类型变换处理,以获得第二类型的图像,所述第二类型的图像用于作为所述识别模块的训练样本;
所述第一类型为采用可见光摄像头拍摄的图像类型,所述第二类型为采用红外摄像头拍摄的图像类型;
所述类型变换模块包括类型变换子网络和类型分类器,所述识别模块包括特征提取器和分类器,其中:
所述类型变换子网络用于对所述第一类型的图像进行类型变换处理,并输出第二类型的图像;
所述类型分类器用于判断所述类型变换子网络输出的图像的类型,并输出类型分类结果;
所述特征提取器用于提取所述第一类型的图像的第一特征向量和所述类型变换子网络输出的所述第二类型的图像的第二特征向量;以及
所述分类器用于基于所述特征提取器提取的第二特征向量进行目标对象识别,以生成所述第二类型的图像的预测标签;
所述神经网络模型的训练包括:
将第一类型的样本图像输入到所述神经网络模型,并获得第二类型的样本图像;
基于所述特征提取器提取的所述第一类型的样本图像的第一特征向量和所述第二类型的样本图像的第二特征向量计算特征向量损失;
基于所述分类器生成的所述第二类型的样本图像的预测标签与所述第一类型的样本图像中预先标注的真实标签之间的差异计算分类损失;
基于预先训练好的类型分类器所生成的类型分类结果计算类型变换损失;以及
基于所述特征向量损失、所述分类损失和所述类型变换损失优化所述神经网络模型的参数。
2.根据权利要求1所述的图像处理方法,其特征在于,计算所述特征向量损失包括:
基于从同一目标对象的所述第一特征向量与所述第二特征向量之间的差异计算特征向量拉近损失;
基于特征向量类内损失与特征向量类间损失之间的差值计算特征向量推远损失,其中,所述特征向量类内损失表示分别从同一对象的多张第二类型的样本图像中提取的多个所述第二特征向量之间的差异,所述特征向量类间损失表示分别从不同对象的所述第二类型的样本图像中提取的所述第二特征向量之间的差异。
3.根据权利要求1所述的图像处理方法,其特征在于,所述类型分类器的训练包括:
分别将经预处理后的第一类型的训练图像和第二类型的训练图像输入到待训练的类型分类器,并生成类型分类结果;
根据所述类型分类结果计算类型分类损失;以及
基于所述类型分类损失训练所述类型分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910859964.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





