[发明专利]一种基于深度学习的铝材表面缺陷检测算法有效
| 申请号: | 201811629224.3 | 申请日: | 2018-12-24 |
| 公开(公告)号: | CN109711474B | 公开(公告)日: | 2023-01-17 |
| 发明(设计)人: | 陈楚城;戴宪华 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/762;G06T7/00 |
| 代理公司: | 北京盛询知识产权代理有限公司 11901 | 代理人: | 郭成文 |
| 地址: | 510275 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 表面 缺陷 检测 算法 | ||
1.一种基于深度学习的铝材表面缺陷检测算法,其特征在于包括如下步骤:
(1)图像采集,利用摄像头对铝材表面进行拍摄,获取相关的图像并对图像重命名,采用labelImg工具对拍摄的图像进行标注,获取图像中关于缺陷的标签,缺陷的标签包含了缺陷在图像中左上角的坐标(x1,y1),右下角的坐标(x2,y2)和缺陷的类别defectN,其中N表示数字,如果拍摄的图像中没有缺陷,不会用labelImg进行处理,只记录其类别信息norm;
(2)图像划分,将图像划分成训练集和测试集两部分,两个部分不存在相同的图像,训练集用来训练检测模型,测试集用来评估检测模型的性能;
(3)图像预处理,包括随机上下翻转、随机左右翻转和随机光照改变,其中随机上下翻转、随机左右翻转和随机光照改变只针对训练集,当进行随机上下翻转和随机左右翻转的时候,缺陷的坐标信息也需要做出相应的变化;
(4)训练检测模型,将经过图像预处理后的训练集中的图像和标签信息输入到铝材表面缺陷检测模型中进行训练,每次同时输入一张有缺陷的图像和一张无缺陷的图像,获取各图像中缺陷的预测框和类别,并与实际的标签信息中的真实框和类别进行对比,计算出定位误差和分类误差,然后采用多学习任务的方法,利用带动量的梯度下降算法进行训练;
(5)检测铝材图像,将测试集中的图像输入到训练好的铝材表面缺陷检测模型中进行检测,获得铝材图像中缺陷的位置和类型;
所述步骤(5)中测试过程具体为测试图像通过铝材表面缺陷检测模型后得到若干个预测框的位置和对应的类别,对这些预测框进行软的非极大值一致,最后保留类别置信度高于某个阈值的若干个预测框作为最后的输出结果;
对得到的预测框使用软的非极大值抑制,最后保留类别置信度高于某个阈值的若干个候选框作为最后的输出结果,具体就是针对所有的预测框采用以下方式进行处理:
首先,对于某一类别的缺陷,按照得到的置信度进行从大到小的排序,然后固定第1个预测框,依次计算其与第2个到最后一个预测框的交叠率,如果交叠率小于等于某一阈值,对应预测框的置信度不变化,如果交叠率大于某一个阈值,则更新该预测框对应此类别的置信度,更新置信度的公式为:
其中M表示固定的候选框,bi表示与固定的预测框进行交叠率计算的候选框,si表示bi对应此类别的置信度,δ是超参数;
采用迭代的方式依次固定第2个,第3个…,倒数第2个预测框,进行上面的操作;同样的,对于其他类别也采用以上方式进行处理;
最后输出类别置信度高于某个阈值的预测框,作为铝材表面缺陷检测模型的输出结果。
2.根据权利要求1所述的一种基于深度学习的铝材表面缺陷检测算法,其特征是:
所述步骤(4)中训练包括基于利用Kmeans聚类算法获取训练集中真实框的分布的步骤、基于有缺陷的图像和无缺陷图像的双图像输入的步骤、基于带有Feature pyramidNetwork(FPN)的Faster R-CNN模型的步骤、RoI Align池化步骤、基于上下文的调整候选区域的步骤和多任务学习的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811629224.3/1.html,转载请声明来源钻瓜专利网。





