[发明专利]基于DDPG-RAM算法的复杂光照条件下织物缺陷检测方法有效
申请号: | 201911129224.1 | 申请日: | 2019-11-18 |
公开(公告)号: | CN110930379B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 柯丰恺;刘欢平;周唯倜;赵大兴;孙国栋;冯维 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/764 |
代理公司: | 武汉开元知识产权代理有限公司 42104 | 代理人: | 王和平;张继巍 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ddpg ram 算法 复杂 光照 条件下 织物 缺陷 检测 方法 | ||
1.一种基于DDPG-RAM算法的复杂光照条件下织物缺陷检测方法,其特征在于:所述检测方法如下:
1)采集织物缺陷图像作为训练样本;
2)对步骤1)中织物缺陷图像进行预处理,选用图像增强算法对复杂光照条件下的织物图像进行图像增强;
3)利用步骤2)中图像增强后的训练样本对DDPG-RAM模型进行训练,确定训练后的网络参数
3.1)构建DDPG-RAM模型,并随机初始化网络参数;
构建DDPG-RAM模型,结合了深度确定性策略梯度(DDPG)算法和循环注意力模型(RAM),该DDPG-RAM模型包括Glimpse网络,Core网络,Action网络,Actor网络和Critic网络五个部分,Actor网络、Critic网络又分别构建了两个结构完全相同但参数不同的eval网络和target网络,从而形成Actor eval网络、Actor target网络、Critic eval网络和Critictarget网络共四个网络,其中,Actor网络为行为网络、Critic网络为评价网络、eval网络为估计网络和target网络为目标网络,Actor eval网络为行为估计网络、Actor target网络为行为目标网络、Critic eval网络为评价估计网络、Critic target网络为为评价目标网络;然后对该RAM模型进行随机初始化,即随机初始化Glimpse网络、Core网络、Action网络、Actor eval网络、Critic eval网络的参数μ(h|θμ)、Q(h,l|θQ),以及将Actor eval网络和Critic eval网络的值赋予与之对应的target网络,即θμ→θμ',θQ→θQ';
fg是Glimpse网络的缩写,代表Glimpse网络参数,l和x是Glimpse网络的输入参数,l代表当前时刻裁剪图像的中心位置,x是被裁剪的完整图像整体;
fh是Core网络的缩写,代表Core网络参数,ht-1和fg是Core网络的输入参数,ht-1代表上一时刻Core网络输出的状态参数;
fa是Action网络的缩写,代表Action网络参数,ht是Action 网络的输入参数,代表当前时刻Action网络输出的状态参数;
μ(h|θμ)代表Actor eval网络,θμ代表Actor eval网络参数,h是Actor eval网络的输入参数,代表经过当前时刻ht经过全连接处理后的参数;
Q(h,l|θQ)代表Critic eval网络,θQ代表Critic eval网络参数;
θμ→θμ'代表将Actor eval网络的参数复制给Actor target网络,
θQ→θQ’代表将Critic eval网络的参数复制给Critictarget网络;
3.2)经验池初始化为0,大小为max_size×(2×ht_dim+2+1);
设经验池为i行、j列的二维矩阵,二维矩阵中每个元素的值初始化为0,其中i为样本容量,j为每个样本储存的信息数量,经验池大小为j=max_size×(2×ht_dim+2+1),其中ht_dim为状态的维度;公式中的数字2为动作的维度,公式中的数字1为用于在经验池中存储奖励信息的预留空间;
3.3)构造一个随机正态分布N对注意力位置施加干扰
3.4)对DDPG-RAM模型进行训练
4)利用训练后的DDPG-RAM算法对复杂光照条件下织物缺陷图像进行缺陷检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911129224.1/1.html,转载请声明来源钻瓜专利网。