[发明专利]一种基于全卷积自编码器网络的无监督瑕疵检测方法有效
申请号: | 201911330016.8 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111383209B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 杨伟嘉;俞祝良 | 申请(专利权)人: | 广州光达创新科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/62;G06V10/764;G06V10/82;G06N3/0455;G06N3/0464;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510700 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 编码器 网络 监督 瑕疵 检测 方法 | ||
1.一种基于全卷积自编码器网络的无监督瑕疵检测方法,其特征在于,包括以下步骤:
S1、构建用于自编码器模型训练与测试的瑕疵图像数据库,自编码器模型包括编码器和解码器;
S2、将图像输入编码器,经过多层的全卷积网络,映射到编码空间;具体包括以下步骤:
S2.1、将训练集中的灰度图像除以255使得输入分布在于0-1区间,便于模型处理;采用三个大小为1*1或3*3的小卷积核的卷积层直接连接构成一个卷积模块,在获得同等视野域的情况下,减少计算量与参数量;移除池化层,在卷积模块最后一层采用卷积步长为2,进行对特征图的压缩;
S2.2、通过堆叠四个卷积模块实现对图像的特征提取,由于灰度图像信息维度少于彩色图像,因此在选择卷积核深度时,对卷积核深度进行压缩,从而减少计算量,同时也避免模型产生过拟合现象;最后将特征图输入至一个卷积核为3*3,步长为2的卷积层,将图像压缩成编码向量,令其包含图像的深度信息;编码器网络层数总共17层,图像经过编码网络处理后压缩形成三维的编码向量;
S3、将编码向量输入到解码器,经过的反卷积网络,得到与原图像相似的图像;采用解码器将图像压缩后的编码向量还原成原来的图像,采用反卷积层对特征图进行上采样,在低层的部分,采用3个大小为1*1或3*3的小卷积核的反卷积层进行堆叠,获取纹理细节;随后分别连接两个大小为5*5和7*7的大卷积核的反卷积层,通过更大的视野域,更好地融合特征信息,从而更完整地还原出原始图像;因此,编码向量经过5个反卷积层,得到一张生成图,其分辨率与原图相同;
S4、计算图像的重构误差,进行平滑处理和孤立点消除后,检测出瑕疵区域;包括以下步骤:
S4.1、对原图与生成图进行比较,计算两者每一个像素的平方误差,得到重构误差,计算公式方式如下:
其中ex,y表示图像横纵坐标x、y处的重构误差,px,y表示原图中坐标x、y的像素值大小,表示生成图中坐标x、y的像素值大小;如果输入图像为正常图,则图像能够很好的被还原,重构误差很小即每个像素点差异不超过10,整个图像的重构误差构成重构误差图;而针对瑕疵区域,经过编码器与解码器构成的自编码器网络后,生成图像会修复瑕疵区域,因而该瑕疵区域的重构误差会很大,从而对瑕疵进行检出;
S4.2、由于瑕疵区域在像素上的连续性,为了减少异常值产生的检测误差,采用一个中值滤波器对重构误差图进行处理,使得重构误差结合了周围区域的信息,提升了检测的鲁棒性;中值滤波器通过一个同等窗口大小的卷积层等效进行实现;
S4.3、将训练集中的正常无瑕疵图像输入模型进行还原,计算出正常图像的重构误差分布;根据实际检测需求对误判率进行设置,设置第一阈值为t1,重构误差大于t1的像素点标记为瑕疵像素;基于噪声的随机性,采用计算重构误差图上连通域区域的方法对孤立的噪点进行去除,此时设置第二阈值为t2,即瑕疵区域联通面积至少t2个像素点才能判断为瑕疵。
2.根据权利要求1所述的一种基于全卷积自编码器网络的无监督瑕疵检测方法,其特征在于,步骤S1包括以下步骤:
S1.1、利用工业摄像机实时获取生产图像,摄像机拍摄的图像为灰度图像;
S1.2、由于正常工作下拍摄产生的图像均为正常无瑕疵样本,获取容易,实时拍摄足够的无瑕疵图像作为训练集;根据瑕疵产生原因,人为制造各类瑕疵图像,并进行拍摄,最终生成对应的瑕疵图像,与正常图像共同构成测试集,用于评价自编码器模型的性能。
3.根据权利要求2所述的一种基于全卷积自编码器网络的无监督瑕疵检测方法,其特征在于,步骤S1.1中,根据生产实际条件,根据产品生产速度与摄像头拍摄到图像面积,确定工业摄像机拍摄的帧率,以保证能够完整清晰地拍摄下产品全貌。
4.根据权利要求1所述的一种基于全卷积自编码器网络的无监督瑕疵检测方法,其特征在于,步骤S4.2中,所述中值滤波器的窗口大小根据实际需求进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州光达创新科技有限公司,未经广州光达创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911330016.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于存储装置中的扩展性错误校正的方法和装置
- 下一篇:多相振荡器电路