[发明专利]一种结合Q-learning与多蜂群算法的疏散路径规划方法及系统有效
申请号: | 202011284240.0 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112330043B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 刘弘;赵缘;李信金;孟祥栋 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26;G06N3/00 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 learning 蜂群 算法 疏散 路径 规划 方法 系统 | ||
1.一种结合Q-learning与多蜂群算法的疏散路径规划方法,其特征在于,包括:
对构建的疏散场景模型初始化疏散人群和疏散出口;
采用多蜂群算法进行宏观路径规划,结合微观人群运动指导驱动个体到达疏散出口,直至疏散出口的疏散人数等于总人数,疏散过程结束;
所述多蜂群算法包括将疏散人群分为多个群组,根据群组内个体所在位置与疏散出口的距离和疏散出口的拥挤度计算适应度,根据适应度值和Q表中待选择搜索策略的质量值确定搜索策略,以此确定下一位置,具体步骤为:
(1)对每个群组中始化一个n行t列的Q表,其中,n为群组中领导者的个数,t是搜索策略的个数;
(2)根据领导者当前位置计算其适应度值,将领导者按照适应度值从大到小进行排序,并对应于Q表的每一行,得到处于状态Sr的个体,即位于第r行的个体,有t个搜索策略可以选择;
(3)每个搜索策略l被选择的概率与搜索策略的质量函数Q值Q(Sr,al)相关,如下式(2),搜索策略的Q值越高,表示被选择的概率越大;
(4)根据所选择的搜索策略更新位置,并在新位置和旧位置之间保留较好的一个,同时根据更新的位置再次计算Q值:
Q(st,at)=Q(st,at)+α·[Rt+γmax Q(st+1,a)-Q(st,at)] (3)
其中,Q(st,at)代表Q值,α为学习率,γ为奖励性系数,R为回报值,max Q(st+1,a)是下一个状态St+1中最大的Q值;回报值R为:
R=fitnessnew-fitnessold (4)
其中,fitnessnew与fitnessold分别为新位置的适应度与旧位置的适应度;
(5)跟随者选择与自己跟随的领导者一致的搜索策略,依次确定下一位置;
(6)每一次迭代后,所有领导者在群组内按照新位置的适应度值大小重新排序,每个领导者获得新的排序状态,在下一次迭代中每个个体按照新的状态行中Q值选择搜索策略并更新位置;
群组中跟随者可选择的领导者范围为群组中适应度值最好的E个领导者,且领导者转化为侦察者后,采用改进的侦查者搜索策略得到新位置;
在构建的搜索策略池中匹配所述待选择搜索策略,所述搜索策略池包括:
根据个体当前位置和在当前群组内随机选择的一个邻居个体位置得到新位置;以领导者当前位置为搜索起点,在两个随机选择的群组内的邻居个体位置的指导下更新位置;以群组内随机选择的一个邻居个体位置为搜索起点,根据群组内随机选择的两个邻居个体位置和最优个体位置得到新位置;以最优个体位置为搜索起点,根据群组内随机选择的两个邻居个体位置得到新位置。
2.如权利要求1所述的一种结合Q-learning与多蜂群算法的疏散路径规划方法,其特征在于,所述将疏散人群分为多个群组包括:
以第一个个体作为第一个中心点,选择与第一个中心点最远的个体作为第二个中心点,以同样方法依次确定其他中心点,直至无新的中心点;
将其余个体按最小距离原则归入最近的中心点;
计算群组中每个个体的适应度值,对适应度值进行排序后选择领导者,其余作为跟随者。
3.如权利要求1所述的一种结合Q-learning与多蜂群算法的疏散路径规划方法,其特征在于,确定下一位置后,根据新位置的适应度值和Q表中待选择搜索策略的质量值重新确定搜索策略并更新位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011284240.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据同步方法、装置、设备及存储介质
- 下一篇:金属氧化物半导体MOS器件
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理