[发明专利]一种基于深度学习的图像颜色矫正方法有效
申请号: | 202011471881.7 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112581373B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 闫波;张晟;宿红毅;郑宏 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06T3/60 | 分类号: | G06T3/60;G06T7/11;G06T7/90;G06N3/08;G06N3/04 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图像 颜色 矫正 方法 | ||
1.一种基于深度学习的图像颜色矫正方法,其特征在于,包括以下步骤:
步骤1:获取图像数据;
步骤2:对所获取到的图像数据集进行数据增强和数据预处理;
步骤3:构建基于Encoder-Decoder的全卷积神经网络,具体如下:
基础卷积神经网络整体采用下采样-上采样结构,由两种基础单元模块构成,在下采样部分中,单元模块由两个卷积层和一个池化层构成,图像经卷积层处理后,通过激活函数进行激活;在上采样部分中,单元模块由上采样层和两个卷积层构成,图像经卷积层处理后也会通过激活函数进行激活;每一次经过激活函数激活后,都经过BatchNorm层进行归一化;
为了保证网络的灵活性,下采样和上采样的次数可调节;
整体神经网络结构为下采样-上采样的Encoder-Decoder结构,下采样处理模块和上采样处理模块数量一致,并且下采样每一层的输出都会作为一部分输入连接到上采样中作为输入,用于补充图像的浅层信息;
步骤4:将单级的全卷积神经网络进行级联,获得最终的级联神经网络,同时,针对级联神经网络设计对应的损失函数,具体如下:
步骤4.1:级联卷积神经网络由2个以上的步骤3构建的基础卷积神经网络构成,每一个基础卷积神经的输出都会作为下一个基础卷积神经网络的输入,并向下传播;
步骤4.2:将初始图像持续加入至后续的级联网络中作为输入;
步骤4.3:设计特定的损失函数;
每一级的卷积神经网络都会输出其矫正后的图像,将其与标准图像进行LOSS值的计算,得到每一级的LOSS值;
在得到每一级的LOSS值之后,组成级联神经网络的整体LOSS值,采用线性组合的方式,公式如下:
其中,Lk为第k级网络的输出和标准图像之间的LOSS值,αk为该级对应的有效系数,所有级的有效系数之和为1;将每一级别对应的LOSS和其有效系数相乘并相加,得到整体网络的LOSS值;
步骤5:将预处理过后的图像数据集用于级联神经网络训练,得到训练好的级联神经网络模型;
步骤6:将采集到的色偏图像,放入到训练好的模型中进行实时色偏矫正,得到校正好的无色偏的图像。
2.如权利要求1所述的一种基于深度学习的图像颜色矫正方法,其特征在于,步骤1的具体实现方法如下:
步骤1.1:使用图像采集设备对目标场景进行拍照;对于同一场景,拍照应该在标准光照环境和非标准光照环境下同时进行拍照,标准光照环境指应该在D65光源的充分照射下拍照,非标准光照环境包括但不限于过暗或过亮、曝光过度或不足、其他不同色温的光源;
步骤1.2:对于收集到的图片进行标注;对于同一场景拍摄到的图像,要分别标注哪些是标准光照环境拍照得到的,哪些是非标准光照环境拍照得到的,同时构建成对的数据集,存入数据库中。
3.如权利要求1所述的一种基于深度学习的图像颜色矫正方法,其特征在于,步骤2的具体实现方法如下:
步骤2.1:对所获得的图像数据,以图片中心进行下采样,得到像素值为固定像素大小的图像;
步骤2.2:对下采样过后的图像数据进行镜像反转、旋转、扭曲和随机裁剪,进行数据增强。
4.如权利要求3所述的一种基于深度学习的图像颜色矫正方法,其特征在于,步骤2.2的具体实现方法如下:
步骤2.2.1:对图像数据进行水平和垂直镜像反转,进行数据扩增;
步骤2.2.2:进行旋转操作;包括对原图像进行顺时针旋转,进行数据扩增;
步骤2.2.3:进行剪裁操作;通过滑动窗口的方式在原始图像上进行随机游走进行剪裁;
步骤2.3:对扩增好的数据进行训练集和测试集的划分,得到最终处理好的数据集。
5.如权利要求1所述的一种基于深度学习的图像颜色矫正方法,其特征在于,步骤3中,上采样过程采取双线性插值法进行上采样。
6.如权利要求1所述的一种基于深度学习的图像颜色矫正方法,其特征在于,步骤4.3中,LOSS从MSE-LOSS、SSIM-LOSS、MSSIM-LOSS中选取一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011471881.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序