[发明专利]一种基于改进型unet++网络的图像去高光方法及系统在审
申请号: | 202210537648.7 | 申请日: | 2022-05-17 |
公开(公告)号: | CN114998121A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 叶敏超;陈华华;叶学义;郭春生 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 周希良 |
地址: | 310018 浙江省杭州市杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进型 unet 网络 图像 去高光 方法 系统 | ||
1.一种基于改进型unet++网络的图像去高光方法,其特征是按如下步骤:
步骤(1),构建去高光网络模型,将高光图输入到去高光网络模型,以获取预测的高光掩码、高光层图以及无高光图;
步骤(2),训练去高光网络模型,获得网络模型参数。
2.如权利要求1所述一种基于改进型unet++网络的图像去高光方法,其特征是,步骤(1)具体如下:
所述的去高光网络模型是一个端到端的网络模型,在深度学习中引入高光形成模型,利用领域知识对深度学习加以辅助引导;去高光网络模型包括两部分:改进型unet++网络、DDCM-Net网络结构;
高光形成模型公式为:其中,I表示为原反射光强度图像,S表示为高光层图,M表示为高光掩码,D表示无高光图,表示为元素对应相乘;
所述改进型unet++网络结构的深度有5层,包括卷积网络、改进的ACBlock网络、下采样、上采样以及跳层连接;
所述的卷积网络共有15个子卷积网络,第一、二、三、四、五层分别有5、4、3、2、1个子卷积网络,每个子卷积网络有两个卷积块A,每个卷积块A包括一个卷积层、归一化层和一个激活层;其中,卷积层采用3×3尺寸卷积核,滑动步长为1,零边缘填充尺寸为1;激活层采用ReLU函数;
所述改进的ACBlock网络采用一维水平核的卷积块B1和一维垂直核的卷积块B2,将卷积块B1和卷积块B2的输出求和,此处的卷积块B1与卷积块B2均包括卷积层、归一化层;其中,卷积块B1的核尺寸为1×3,卷积块B2的核尺寸为3×1;改进的ACBlock网络输出尺寸大小与输入尺寸大小相同;
所述下采样采用核尺寸为2×2的最大池化层;第一层的输入数据为256×256×3,经过第一层第1个子卷积网络后的输出尺寸为256×256×32,经过下采样到第二、三、四、五层的输出尺寸分别为128×128×64,64×64×128,32×32×256,16×16×512;
所述上采样采用核尺寸为2×2的卷积核;第五层的子卷积网络输出尺寸为16×16×512,经过上采样到第四、三、二、一层的输出尺寸分别为32×32×512,64×64×256,128×128×128,256×256×64;
所述的跳层连接是指每一层的每一个子卷积网络的输入是前面所有子卷积网络的输出与下一层子卷积网络的上采样输出特征拼接融合,再将当前特征传递给之后的网络;第一层第1个子卷积网络的输入尺寸大小为256×256×3,输出尺寸大小为256×256×32;第一层第2个子卷积网络的输入尺寸大小为256×256×96,输出尺寸大小为256×256×32;第一层第3个子卷积网络的输入尺寸大小为256×256×128,输出尺寸大小为256×256×32;第一层第4个子卷积网络的输入尺寸大小为256×256×160,输出尺寸大小为256×256×32;第一层第5个子卷积网络的输入尺寸大小为256×256×192,输出尺寸大小为256×256×32;第二层第1个子卷积网络的输入尺寸大小为128×128×64,输出尺寸大小为128×128×64;第二层第2个子卷积网络的输入尺寸大小为128×128×192,输出尺寸大小为128×128×64;第二层第3个子卷积网络的输入尺寸大小为128×128×256,输出尺寸大小为128×128×64;第二层第4个子卷积网络的输入尺寸大小为128×128×320,输出尺寸大小为128×128×64;第三层第1个子卷积网络的输入尺寸大小为64×64×128,输出尺寸大小为64×64×128;第三层第2个子卷积网络的输入尺寸大小为64×64×384,输出尺寸大小为64×64×128;第三层第3个子卷积网络的输入尺寸大小为64×64×512,输出尺寸大小为64×64×128;第四层第1个子卷积网络的输入尺寸大小为32×32×256,输出尺寸大小为32×32×256;第四层第2个子卷积网络的输入尺寸大小为32×32×768,输出尺寸大小为32×32×256;最后,第一层第5个子卷积网络的输出依次经过1×1卷积与sigmoid函数,获得特征图尺寸大小为256×256×3;
所述DDCM-Net网络共有三个;第一个DDCM-Net的输入尺寸大小为256×256×3,输出尺寸大小为256×256×3,第二个DDCM-Net的输入尺寸大小为256×256×6,输出尺寸大小为256×256×3,第三个DDCM-Net的输入尺寸大小为256×256×9,输出尺寸大小为256×256×3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210537648.7/1.html,转载请声明来源钻瓜专利网。