[发明专利]一种基于强化学习的人群疏散仿真方法、装置有效
申请号: | 201710666611.3 | 申请日: | 2017-08-07 |
公开(公告)号: | CN107464021B | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 刘弘;刘宝玺;张浩;秦欣 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/26 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
地址: | 250014 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于强化学习的人群疏散仿真方法、装置,方法包括获取指定区域的视频录像,利用KLT追踪算法从所述视频录像中提取出人群疏散路径、初始坐标、运动速度和出口位置;将所述人群疏散路径按照以点带线的方式进行存储;根据所述初始坐标,对人群进行分组,选取组内最靠近出口位置的行人作为组内引领者;各引领者选择最佳出口作为疏散目标,利用强化学习算法在所述人群疏散路径中选择最佳疏散路径,引领者带领组内普通行人按照最佳疏散路径运动;保存各组最佳疏散路径,作为疏散演练的推荐路径。 | ||
搜索关键词: | 一种 基于 强化 学习 人群 疏散 仿真 方法 装置 | ||
【主权项】:
1.一种基于强化学习的人群疏散路径推荐方法,其特征在于,包括以下步骤:获取指定区域的视频录像,利用KLT追踪算法从所述视频录像中提取出人群疏散路径、初始坐标、运动速度和出口位置;将指定区域进行网格划分,利用划分好的网格对所提取的人群疏散路径进行合并、去重,构建出指定区域内的疏散路径网,合并后的人群疏散路径以点序列的形式存储至路径知识库中备用;将所述人群疏散路径按照以点带线的方式进行存储;根据所述初始坐标,对人群进行分组,选取组内最靠近出口位置的行人作为组内引领者;各引领者选择最佳出口作为疏散目标,利用强化学习算法在所述人群疏散路径中选择最佳疏散路径,引领者带领组内普通行人按照最佳疏散路径运动;保存各组最佳疏散路径,作为疏散演练的推荐路径;所述利用强化学习算法在人群疏散路径中选择最佳疏散路径包括:计算所有和引领者当前位置连通的下一个点的收益值,并选取收益值最大的点作为目标点,该目标点与引领者当前位置的连线即为最佳疏散路径;所述计算所有和引领者当前位置连通的下一个点的收益值,并选取收益值最大的点作为目标点包括:计算引领者当前位置与目标点之间的距离,将此距离作为强化学习状态值s;引领者根据当前位置,在动作方向a中选择,所述a包括上、下、左、右、左上、左下、右上和右下,若引领者选择动作方向a使得强化学习状态值s减少,既缩短了到达目标的距离,则更新该点的收益值Q(a,si+1)=Q(a,si)+1;若引领者选择动作方向a后,增大了到达目标的距离,则更新Q(a,si+1)=Q(a,si)‑1;所述各引领者选择最佳出口作为疏散目标包括:引领者根据距离各个出口位置的距离和各个出口的拥挤度,选择最佳出口作为疏散目标;在以出口位置为中心,设定区域内设置计数器,根据计数器的结果与设定区域的面积,计算各个出口的拥挤度;设置拥挤度阈值,当出口拥挤度大于所述拥挤度阈值时,认为出口发生了拥堵;设置出口疏散效率为vγ,表示出口每秒能通过vγ个人;设置个体疏散的速度为v0,表示个体每秒行走v0米;当出口的拥挤度大于拥挤度阈值时,则计算出口疏散预计花费时间t1=pi(t)/vγ,其中Pi(t)为出口在设定时刻、设定面积内的个体数;当出口的拥挤度不大于拥挤度阈值时,则选择出口疏散预计花费时间t2=Disi/v0,其中Disi为引领个体到出口的距离,t2表示引领个体正常运动到出口的时间;计算所有出口的疏散预计花费时间并进行比较,选择最短花费时间的出口作为疏散目标。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710666611.3/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理