[发明专利]冲压控制方法有效
| 申请号: | 202011567548.6 | 申请日: | 2020-12-25 |
| 公开(公告)号: | CN112775242B | 公开(公告)日: | 2022-10-28 |
| 发明(设计)人: | 陈国华;韦发彬 | 申请(专利权)人: | 佛山市康思达液压机械有限公司 |
| 主分类号: | B21D22/02 | 分类号: | B21D22/02;G06N3/08 |
| 代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 罗程凯 |
| 地址: | 528000 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 冲压 控制 方法 | ||
1.冲压控制方法,其特征在于,每次冲压过程中,控制冲压头在向工件行进至稳速段起点时的速度为预设的第一速度,并控制冲压头在稳速段内以第一速度匀速行进;稳速段为预冲行程的其中一段,稳速段的终点为工进开始位,预冲行程为冲压头从其初始位置行进至工进开始位的行程,工进开始位为冲压头开始接触工件的位置,所述预设的第一速度通过以下步骤确定:
每次冲压行程结束后,检测实际的工进结束位;
计算实际的工进结束位与预设的工进结束位之间的偏差数值的绝对值p,所述偏差数值为实际的工进结束位与预设的工进结束位的距离差值;
采用Sarsa算法进行强化学习:
建立奖励矩阵
初始化Q表,将Q表全部置零;
状态S为当前p的大小;
设置期望状态Sterminal为p取整后为0;
使用∈-greedy算法在状态S下选取动作
其中,random A表示从动作集合(加大第一速度,减小第一速度)中随机选取动作A,maxAQ(S,A)表示选择使Q(S,A)值最大的动作A,
Q(S,A)为在状态S下执行动作A的动作价值函数,rand为随机数,∈为贪婪因子;
SAR步骤:在状态S下执行动作A,改变第一速度,进入下一状态S',查阅奖励矩阵reward得到奖励R;更新Q表中状态S和动作A对应的Q(S,A),跳转至SA步骤;
更新规则为Q(S,A)=Q(S,A)+α(R+γQ(S',A')-Q(S,A)),
其中,R+γQ(S',A')-Q(S,A)为TD误差,α为学习率,γ为衰减因子;
SA步骤:使用∈-greedy算法在状态S'下选取动作A';
将状态S'赋值给状态S,将状态A'赋值给状态A,回到SAR步骤;
直到状态S=Sterminal时,保持当前第一速度不变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山市康思达液压机械有限公司,未经佛山市康思达液压机械有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011567548.6/1.html,转载请声明来源钻瓜专利网。





