[发明专利]基于强化学习的工业产品多道检测方法及系统在审
申请号: | 202310513816.3 | 申请日: | 2023-05-08 |
公开(公告)号: | CN116433650A | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 薛晨阳;黄佳康;黄锐;王儒贤 | 申请(专利权)人: | 上海互觉科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G01D11/00;G01D21/00;G06N3/04;G06N3/08 |
代理公司: | 上海锻创知识产权代理有限公司 31448 | 代理人: | 何惠燕 |
地址: | 201100 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 工业产品 多道 检测 方法 系统 | ||
本发明提供了一种基于强化学习的工业产品多道检测方法及系统,包括:步骤S1:获取同一工件相邻工序的检测结果数据集;步骤S2:筛选检测结果数据集中的检测信息;步骤S3:设置卡控条件;步骤S4:对卡控条件进行最优解求解。本发明提出的基于强化学习的多道检测策略,经过不断的从环境的经验中学习,根据给予一定的奖励,使其最终找到价值函数的最优解,可以很好的提升整体检测的效率,能有效解决了单道工序检测单一,导致多道检测出现的浪费问题。
技术领域
本发明涉及工业生产领域,具体地,涉及一种基于强化学习的工业产品多道检测方法及系统。
背景技术
工业产品的生产流程较长,通常会在关键的生产工序后设置检测机台,且前道生产工序后检测结果中不影响当前产品质量的,在后道生产工序后可能演变为影响产品质量的缺陷。传统的多道检测工艺,每一道检测只会去检测设备预先设置好的针对这一道工序的检测结果,而有一些在前道工序可以检测出来的部分,可能对当前工序并没有实质影响,但后续经过加工或是其他处理之后,可能到某个工序才会检测出工件NG报废,这样会导致效率较低且有检测浪费的情况。
专利文献CN111368970A公开了一种基于深度强化学习的传感器优化布置方法,涉及结构健康监测和振动测试领域,首先,基于互信息相关理论推导得到工程结构传感器优化布置准则,然后通过基于深度强化学习的优化算法快速有效地寻找目标函数的最优解,即结构的最优传感器布置位置。其缺点为:1.针对问题专门设计模型,对模型利用强化学习求最优解,通用性较差;2.其针对价值函数的计算设计了专门的神经网络,再可复用性上较差,可以根据实际场景直接编写相应的价值函数代码,神经网络的中间过程也不可预知,可解释性较差。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于强化学习的工业产品多道检测方法及系统。
根据本发明提供的一种基于强化学习的工业产品多道检测方法,包括:
步骤S1:获取同一工件相邻工序的检测结果数据集;
步骤S2:筛选检测结果数据集中的检测信息;
步骤S3:设置卡控条件;
步骤S4:对卡控条件进行最优解求解。
优选地,在所述步骤S1中:
收集相邻工序中出现的所有工件的检测结果,并存储于检测结果信息文件中,检测结果信息文件的格式包括CSV、BMP,含有信息包括所属工件的标识符、每个检测结果的位置、检测结果的类型、检测结果的大小和检测结果的形状和数量;通过读取工具读取检测结果信息文件,读取工具包括Pandas、OpenCV,利用工件标识符在相邻工序中进行工件匹配,工件标识符包括OCRSTRING,得到同一工件的相邻工序的检测结果数据集。
优选地,在所述步骤S2中:
多道检测策略的生成方法,根据实际情况选取检测结果作为卡控条件设置的前提,根据经验或者观察出的特征筛选合适的检测结果,包括:
检测结果形状突出,包括边缘凹凸较多的不规则的检测结果;
检测结果的尺寸大于预设标准;
检测结果的类别属于预设标准,包括毛刺、异物和前后工序形状差别大于预设标准的检测结果;
同类型检测结果数量大于预设值。
优选地,在所述步骤S3中:
卡控条件的设置是多元多目标的非线性规划,根据尺寸形状类别多个特征进行多重条件设置,在应用过程中,根据相邻工序的检测结果之间的关联,以检测结果的尺寸、检测结果的形状、检测结果的类别、检测结果的位置、检测结果的灰度分布作为基本条件,对基本条件设置数量的卡控,定义以下变量:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海互觉科技有限公司,未经上海互觉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310513816.3/2.html,转载请声明来源钻瓜专利网。