[发明专利]基于多任务卷积神经网络的图像模糊与噪声评测方法有效
申请号: | 201710321137.0 | 申请日: | 2017-05-09 |
公开(公告)号: | CN107133948B | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 段翰聪;文慧;赵子天;唐结玲;张帆 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 郭受刚 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 卷积 神经网络 图像 模糊 噪声 评测 方法 | ||
1.基于多任务卷积神经网络的图像模糊与噪声评测方法,其特征在于,所述方法包括:
步骤1:收集失真和对应高质的图片,对收集的图片进行人脸检测和对齐处理,然后再进行标定包括:模糊类型标定,模糊程度标定,噪声水平标定,标定后的图片组成数据集;
步骤2:用步骤1生成的数据集样本训练多任务卷积神经网络,得到用于图像模糊与噪声评测的网络模型;该网络模型共有三个任务输出,分别对应:模糊类型判定、模糊度估计、噪声水平估算;该网络模型融合多个卷积层得到全连接层,全连接层中包括三个特征层:模糊度估计特征层、模糊类型判定特征层、噪声水平估计特征层;融合的方法为:对最后一个卷积层分别进行最大和平均的全局池化操作,对得到的融合结果分别做规范化后,对得到的两个特征向量级联作为图像表示;对浅层卷积层进行同样的操作得到浅层图像表示后,对两个图像表示做二次级联得到最终图像表示;
步骤3:对一张已经检测和对齐的人脸图片,输入到步骤2得到的网络模型中,进行图像模糊类型判定、模糊度估计、噪声水平估计得到:模糊度估计值a,为最终模糊度评测值,得到运动模糊与失焦模糊概率pi,如果a小于阈值C,则判定结果为图像清晰,否则最终模糊类别判定结果为概率大的类别;得到噪声水平估计值b,为最终噪声水平估计值。
2.根据权利要求1所述的基于多任务卷积神经网络的图像模糊与噪声评测方法,其特征在于,模糊类型包括:运动模糊和失焦模糊,模糊度为一个0至1的对图片整体模糊程度的主观评价值。
3.根据权利要求1所述的基于多任务卷积神经网络的图像模糊与噪声评测方法,其特征在于,模糊类型判定的目标函数为:
多任务卷积神经网络预测两个值,模糊类型包括:运动模糊和失焦模糊,设定若标定的图片模糊度大于阈值α,认为存在模糊,l=1;若图片标定的模糊度小于α,认为图片不存在模糊,l=0;使用softmax损失函数作为目标函数:
loss1=l(-(1-g)log(1-p1)-glog(p2))
其中,loss1为模糊内类判定的损失值,l为图像标定的模糊类别;若图片为运动模糊g=0,否则g=1,p1,p2是网络计算出的两个概率值,p1表示图片为运动模糊的概率,p2表示图片为失焦模糊的概率。
4.根据权利要求1所述的基于多任务卷积神经网络的图像模糊与噪声评测方法,其特征在于,模糊度估计的目标函数为:
多任务卷积神经网络预测模糊度,根据学习模糊度判断图像是否需要进行去模糊操作,使用欧氏距离的loss函数去学习图像模糊度为:
其中,loss2为模糊度估计的损失值,d'为预测的模糊度,d为图像模糊度的主观评价值。
5.根据权利要求1所述的基于多任务卷积神经网络的图像模糊与噪声评测方法,其特征在于,噪声水平估计的目标函数为:
网络预测噪声水平,使用欧氏距离的loss函数去学习图像的噪声水平,计算式如下:
'
其中,loss3为噪声水平估计的loss值,n为预测的噪声水平,n为图像噪声水平的主观评价值。
6.根据权利要求1所述的基于多任务卷积神经网络的图像模糊与噪声评测方法,其特征在于,多任务卷积神经网络的总loss函数为loss1、loss2、loss3函数的加权之和,计算方式如下:
其中,loss1为模糊内类判定的损失值,loss2为模糊度估计的损失值,loss3为噪声水平估计的loss值,λt为预设的三个任务的权重系数,losst对应多任务卷积神经网络的模糊类别判定损失,模糊度估计损失,噪声水平估计损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710321137.0/1.html,转载请声明来源钻瓜专利网。