[发明专利]一种非泊松工件流CSPS系统优化控制及仿真测试方法有效
申请号: | 201810402936.5 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108614417B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 唐昊;苏娜;戴飞;周雷 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G05B13/02 | 分类号: | G05B13/02;G05B17/02 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种非泊松工件流CSPS系统优化控制及仿真测试方法,其特征是:用马尔可夫调制泊松过程MMPP模拟非泊松到达过程,获得非泊松工件流CSPS系统优化控制策略;在相同的理论平均到达率下,测试非泊松工件流CSPS系统优化控制策略;在工件非泊松到达情况下,以统计平均到达率作为工件标准泊松到达率,测试非泊松工件流CSPS系统优化控制策略。本发明能在工件非泊松到达,CSPS系统无法建立为SMDP模型情况下,获得系统优化控制策略并测试Q学习算法的适用性。 | ||
搜索关键词: | 一种 非泊松 工件 csps 系统 优化 控制 仿真 测试 方法 | ||
【主权项】:
1.一种非泊松工件流CSPS系统优化控制,所述系统为单站点CSPS系统,包括:匀速运动的传送带(1)、缓存库(2)、加工站(3)、成品库(4)、前视摄像头(5)、机械臂(6)以及工件(7);由传送带(1)传送的工件(7)为非泊松工件流;其特征是:按如下步骤获得非泊松工件流CSPS系统的优化控制策略:在所述单站点CSPS系统中,以MMPP模拟所述工件(7)的非泊松工件流到达过程,所述工件(7)的到达率随着马尔可夫Markov的状态转移而改变,在上一到达率状态转移时刻以下一到达率产生新工件;在每个决策时刻,若缓存库(2)为空,由所述机械臂(6)实施捡取动作;若缓存库(2)为满,由所述机械臂(6)实施加工动作;若所述缓存库(2)为非空非满,此时前视距离vs内若存在有工件,所述机械臂(6)则等待其中的第一个工件到达捡取点并捡取工件(7),随后进入下一决策时刻;前视距离内若无工件,所述机械臂(6)则选择为加工动作,加工时间为τ,在经过max(vs,τ)的时间后,系统进入下一决策时刻,在机械臂(6)的加工动作过程中,若仍有工件到达,则任由工件流失;针对以MMPP到达的工件流,按如下过程获得工件的平均到达率:到达率状态转移过程服从Markov过程,MMPP到达率状态空间Φ为:Φ={1,2,…N},N为到达率的个数,状态转移矩阵P如式(1):
Pij是到达率λn从状态i转移到状态j的概率,n∈Φ,i,j∈Φ;逗留时间函数F(λn,t)为服从参数为
的指数分布如式(2),其中t为时间:
到达率λn在状态n的转移率Λn为:
由式(3)表征连续时间Markov链的无穷小矩阵A,Aij为无穷小矩阵A的组成元素,当i=j时,Aij<0,当i≠j时,Aij≥0,i,j∈Φ;
矩阵A满足:
I是单位矩阵;连续时间Markov过程的稳态分布π为:π=(π1,π2,…πN),且由式(4)获得:
则:工件的平均到达率
由式(5)计算获得:
根据Q学习算法按如下方式获得系统控制策略:设置MMPP的到达率参数、状态转移矩阵和逗留时间函数参数,产生非泊松到达的工件流;初始化Q值表并设置初始温度T、Boltzmann常数K和温度衰减因子ξ;采用基于模拟退火的Q学习算法学习系统控制策略,并在系统决策时刻调用当前工件到达时刻;在学习过程中判断系统应该选择随机行动还是贪婪行动,不停更新Q值表,每学习R步后根据衰减因子ξ降低温度T,当满足算法终止条件时结束学习,获得系统控制策略。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810402936.5/,转载请声明来源钻瓜专利网。