[发明专利]一种基于深度学习算法确定图像清晰度的方法及系统在审
| 申请号: | 202010017473.8 | 申请日: | 2020-01-08 |
| 公开(公告)号: | CN111242911A | 公开(公告)日: | 2020-06-05 |
| 发明(设计)人: | 柴胜;杨强;刘华根;何韦澄;王玉鑫 | 申请(专利权)人: | 来康科技有限责任公司 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/00;G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 白晓晰 |
| 地址: | 065001 河北*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 算法 确定 图像 清晰度 方法 系统 | ||
1.一种基于深度学习算法确定图像清晰度的方法,其特征在于,所述方法包括:
获取包含舌部区域的原始脸部图像数据集,并根据原始脸部图像的清晰程度分别对每个原始脸部图像进行清晰程度的标注;
对经过标注的原始脸部图像数据集进行数据增强处理,以获取经过数据增强的脸部图像数据集;
在残差网络的框架基础上搭建深度网络,建立优化器与所述残差网络的关联关系,以构成图像清晰度判断模型,并利用所述经过数据增强的脸部图像数据集对所述图像清晰度判断模型进行训练和测试,以确定经过训练的图像清晰度判断模型;
对待测的包含舌部区域的脸部图像进行预处理,并利用所述经过训练的图像清晰度判断模型对经过预处理的脸部图像进行分析,以确定所述待测的包含舌部区域的脸部图像的图像清晰度。
2.根据权利要求1所述的方法,其特征在于,所述对经过标注的原始脸部图像数据集进行数据增强处理,以获取经过数据增强的脸部图像数据集,包括:
利用颜色空间变换处理、亮度调整处理、饱和度调整处理、通道变换处理、随机裁剪处理、水平镜像处理和归一化处理中的至少一种处理方式,对经过标注的原始脸部图像数据集中的脸部图像数据进行处理,以获取经过数据增强的脸部图像数据集。
3.根据权利要求1所述的方法,其特征在于,所述残差网络为ResNet-18,由17层卷积层和1层完全连接层组成;所述深度网络为SENet,对于SENet,在ResNet-18的框架基础上,加入通道注意力机制,在训练过程中用来选取权重。
4.根据权利要求3所述的方法,其特征在于,所述利用所述经过数据增强的脸部图像数据集对所述图像清晰度判断模型进行训练和测试,以确定经过训练的图像清晰度判断模型,包括:
残差网络ResNet的卷积层组的网络权值采用ResNet-18的网络权值初始化,ResNet结构的完全连接层的网络权值则为随机初始化;
残差网络ResNet的卷积层组和全连接层的初始学习率设置为0.01,利用CrossEntropy作为损失函数,前期第一预设个数的训练样本在进行迭代训练时的学习率不变,后期每隔第二预设个数的训练样本在进行迭代训练时的学习率下降到0.001与0.0001;
在所述经过数据增强的脸部图像数据集中随机选取预设百分比阈值的脸部图像作为训练集,剩余的脸部图像作为测试集,以进行训练和测试;
采用随机梯度下降算法,对图像清晰度判断模型进行迭代训练,并选取损失函数最小的网络模型作为经过训练的图像清晰度判断模型。
5.根据权利要求1所述的方法,其特征在于,所述对待测的包含舌部区域的脸部图像进行预处理,并利用所述经过训练的图像清晰度判断模型对经过预处理的脸部图像进行分析,以确定所述待测的包含舌部区域的脸部图像的图像清晰度,包括:
按照预设的尺寸对待测的包含舌部区域的脸部图像进行缩放处理,并减去各个通道的均值,以获取经过预处理的待测的包含舌部区域的脸部图像;
利用所述经过训练的图像清晰度判断模型对经过预处理的脸部图像进行分析,获取不同清晰程度对应的概率值,并选取最大概率值对应的清晰程度为所述待测的包含舌部区域的脸部图像的图像清晰度;
其中,所述清晰程度,包括:清晰、比较清晰和不清晰。
6.一种基于深度学习算法确定图像清晰度的系统,其特征在于,所述系统包括:
清晰程度标注单元,用于获取包含舌部区域的原始脸部图像数据集,并根据原始脸部图像的清晰程度分别对每个原始脸部图像进行清晰程度的标注;
数据增强处理单元,用于对经过标注的原始脸部图像数据集进行数据增强处理,以获取经过数据增强的脸部图像数据集;
图像清晰度判断模型确定单元,用于在残差网络的框架基础上搭建深度网络,建立优化器与所述残差网络的关联关系,以构成图像清晰度判断模型,并利用所述经过数据增强的脸部图像数据集对所述图像清晰度判断模型进行训练和测试,以确定经过训练的图像清晰度判断模型;
图像清晰度确定单元,用于对待测的包含舌部区域的脸部图像进行预处理,并利用所述经过训练的图像清晰度判断模型对经过预处理的脸部图像进行分析,以确定所述待测的包含舌部区域的脸部图像的图像清晰度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于来康科技有限责任公司,未经来康科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010017473.8/1.html,转载请声明来源钻瓜专利网。





