[发明专利]一种非泊松工件流CSPS系统优化控制及仿真测试方法有效
申请号: | 201810402936.5 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108614417B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 唐昊;苏娜;戴飞;周雷 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G05B13/02 | 分类号: | G05B13/02;G05B17/02 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 非泊松 工件 csps 系统 优化 控制 仿真 测试 方法 | ||
1.一种非泊松工件流CSPS系统优化控制方法,所述系统为单站点CSPS系统,包括:匀速运动的传送带(1)、缓存库(2)、加工站(3)、成品库(4)、前视摄像头(5)、机械臂(6)以及工件(7);由传送带(1)传送的工件(7)为非泊松工件流;其特征是:按如下步骤获得非泊松工件流CSPS系统的优化控制策略:
在所述单站点CSPS系统中,以MMPP模拟所述工件(7)的非泊松工件流到达过程,所述工件(7)的到达率随着马尔可夫Markov的状态转移而改变,在每个到达率的状态转移时刻,以新的到达率产生新工件;
在每个决策时刻,若缓存库(2)为空,由所述机械臂(6)实施捡取动作;若缓存库(2)为满,由所述机械臂(6)实施加工动作;若所述缓存库(2)为非空非满,此时前视距离内若存在有工件,且工件到达捡取点的时间为vs所述机械臂(6)则等待其中的第一个工件到达捡取点并捡取工件(7),随后进入下一决策时刻;前视距离内若无工件,所述机械臂(6)则选择为加工动作,加工时间为τ,在经过max(vs,τ)的时间后,系统进入下一决策时刻,在机械臂(6)的加工动作过程中,若仍有工件到达,则任由工件流失;
针对以MMPP到达的工件流,按如下过程获得工件的平均到达率:
到达率状态转移过程服从Markov过程,MMPP到达率状态空间Φ为:Φ={1,2,…N},N为到达率的个数,状态转移矩阵P如式(1):
Pij是到达率λn从状态i转移到状态j的概率,n∈Φ,i,j∈Φ;
逗留时间函数F(λn,t)为服从参数为的指数分布如式(2),其中t为时间:
到达率λn在状态n的转移速率Λn为:由式(3)表征连续时间Markov过程的无穷小矩阵A,Aij为无穷小矩阵A的组成元素,当i=j时,Aij<0,当i≠j时,Aij≥0,i,j∈Φ;
无穷小矩阵A满足:I是单位矩阵;
连续时间Markov过程的稳态分布π为:π=(π1,π2,…,πN),且由式(4)获得:
则:工件的平均到达率由式(5)计算获得:
其中,π1表示到达率状态1的稳态概率,π2表示到达率状态2的稳态概率,πN表示到达率状态N的稳态概率;
根据Q学习算法按如下方式获得系统控制策略:
设置MMPP的到达率λn、状态转移矩阵和逗留时间函数F(λn,t)中的转移速率产生非泊松到达的工件流;初始化Q值表并设置初始温度T和温度衰减因子ξ;
采用基于模拟退火的Q学习算法学习系统控制策略,并在系统决策时刻调用当前工件到达时刻;在学习过程中判断系统应该选择随机行动还是贪婪行动,不停更新Q值表,每学习R步后根据衰减因子ξ降低温度T,当满足算法终止条件时结束学习,获得系统控制策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810402936.5/1.html,转载请声明来源钻瓜专利网。