[发明专利]图像处理方法、装置和计算机可读存储介质在审
| 申请号: | 202110410920.0 | 申请日: | 2021-04-16 |
| 公开(公告)号: | CN113111947A | 公开(公告)日: | 2021-07-13 |
| 发明(设计)人: | 陶大程;王文;翟伟 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 孙玉;许蓓 |
| 地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 处理 方法 装置 计算机 可读 存储 介质 | ||
本公开涉及一种图像处理方法、装置和计算机可读存储介质,涉及计算机技术领域。本公开的方法包括:获取源域图像的源域内容特征,获取目标域图像的目标域风格特征;以生成的新风格特征与源域图像的源域风格特征和目标域风格特征不同、各种新风格特征不同,以及新风格特征与源域内容特征结合生成的图像与源域图像的语义一致为目标,生成多种新风格特征,并更新源域内容特征和目标域风格特征;将生成的多种新风格特征和更新后的目标域风格特征分别与更新后的源域内容特征结合,分别生成第一图像和第二图像;利用第一图像、第二图像、源域图像对目标检测模型进行训练,得到训练完成的目标检测模型。
技术领域
本公开涉及计算机技术领域,特别涉及一种图像处理方法、装置和计算机可读存储介质。
背景技术
在实际生活中,对人类所感兴趣的目标进行自动化且准确的检测具有广泛的应用价值。例如,通过目标检测,自动驾驶系统能够有效避让行人和障碍,遥感系统能够定位到人类感兴趣的区域,工业生产线能够筛选并定位存在瑕疵的零件。
现有的目标检测算法往往在精心采集的高质量清晰数据集上训练。然而,现实中由于天气变化、光照变化、物体运动、数据采集等原因,图像往往存在对比度下降、模糊、噪声等质量下降问题。因此,实际进行目标检测的图像是与训练图像的风格不同的降质图像。
发明人已知的基于域适应的鲁棒目标检测算法,即通过对抗训练等方法实现特征分布对齐,从而将源域标注数据上训练的模型更好的泛化到目标域上。这类方法往往假设目标域中仅存在一种降质类型(风格类型)。
发明内容
发明人发现:现实中训练完成一个目标检测模型常常需要对多种降质类型(风格类型)的图像都能做出准确检测。而现有的训练方法无法使目标检测模型识别多种风格类型的图像。此外,在实际应用场景种获取多种风格类型图像并进行风格类型的标注用于训练往往需要大量的人力物力。
本公开所要解决的一个技术问题是:如何提高目标检测模型训练的效率以及有效性。
根据本公开的一些实施例,提供的一种图像处理方法,包括:获取源域图像的源域内容特征,获取目标域图像的目标域风格特征;以生成的新风格特征与源域图像的源域风格特征和目标域风格特征不同、各种新风格特征不同,以及新风格特征与源域内容特征结合生成的图像与源域图像的语义一致为目标,生成多种新风格特征,并更新源域内容特征和目标域风格特征;将生成的多种新风格特征和更新后的目标域风格特征分别与更新后的源域内容特征结合,分别生成第一图像和第二图像;利用第一图像、第二图像、源域图像对目标检测模型进行训练,得到训练完成的目标检测模型。
在一些实施例中,获取源域图像的源域内容特征,获取目标域图像的目标域风格特征包括:利用内容编码器提取源域图像的源域内容特征;利用风格编码器提取目标域图像的目标域风格特征。
在一些实施例中,风格编码器包括风格特征提取网络和聚类模块,利用风格编码器提取目标域图像的目标域风格特征包括:将各个目标域图像输入风格特征提取网络,得到输出的各个目标域图像的基本风格特征;将各个目标域图像的基本风格特征输入聚类模块进行聚类,得到聚类中心的特征向量,作为目标域风格特征。
在一些实施例中,生成多种新风格特征包括:随机生成预设数量新风格特征,并将生成的新风格特征和源域内容特征输入生成网络,得到第一迁移图像;将目标域风格特征和源域内容特征输入生成网络,得到第二迁移图像;根据第一迁移图像与对应的源域图像的风格差异,第一迁移图像与对应的第二迁移图像的风格差异,确定第一损失函数,用于表示生成的新风格特征与源域风格特征和目标域风格特征差异;根据各个第一迁移图像之间的风格差异,确定第二损失函数,用于表示各种新风格特征之间的差异;根据第一迁移图像的语义特征与对应的源域图像的语义特征的差异,确定第三损失函数,用于表示新风格特征与源域内容特征结合生成的图像与源域图像的语义差异;根据第一损失函数、第二损失函数、第三损失函数,调整生成的新风格特征,直至达到与目标对应的预设收敛条件,得到生成的多种新风格特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110410920.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可调持针钳
- 下一篇:一种陶瓷制品制作的干燥装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





