[发明专利]基于共享深度强化学习的建筑物内疏散仿真方法及系统有效
申请号: | 202010175498.0 | 申请日: | 2020-03-13 |
公开(公告)号: | CN111414681B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 刘弘;韩延彬;李梁 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06F111/10 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 共享 深度 强化 学习 建筑物 疏散 仿真 方法 系统 | ||
本公开公开了基于共享深度强化学习的建筑物内疏散仿真方法及系统,包括:每组待疏散人群的引领者与对应的导航Agent连接,每个导航Agent均与管理Agent连接;各导航Agent引导各组疏散,导航Agent均把实时采集的信息及自身经验池存储到管理Agent管理的知识库中;管理Agent对知识库中的所有导航Agent的疏散信息,基于共享的深度强化学习算法进行学习,将学习产生的指导各导航Agent进行路径选择的策略实时发送给导航Agent;每个导航Agent根据接收到的用于指导各导航Agent进行路径选择的策略,进行路径规划;引领者按照对应导航Agent的路径规划,引领对应的群组向疏散出口疏散。
技术领域
本公开涉及人群疏散仿真技术领域,尤其涉及基于共享深度强化学习的建筑物内疏散仿真方法及系统。
背景技术
本部分的陈述仅仅是提到了与本公开相关的背景技术,并不必然构成现有技术。
近年来,随着社会经济的高速发展,各种聚集了大量人群的大型公共活动不断增多,这其中的安全问题引起了越来越多的关注。在一些人员密集的公共建筑场所内,由于在建筑设计上的不合理,以及应急管理方面的不到位,当发生各种紧急突发事件,人员需要紧急撤离时,容易造成疏散人群的拥挤和阻塞,甚至发生严重的人员踩踏事故。
人群踩踏事故是有规律可循的。与地震、海啸等自然灾害不同的是,人群踩踏事故作为一种人为灾难,在事件发展的过程中受到触发因素的推动而逐渐演化产生,通过理论分析、模型验证和软件仿真,有助于人们掌握其触发、演化的一般规律,并采取正确的预防控制措施,为应急管理部门防范人群踩踏风险提供理论依据。
当突发事件发生时,人们由于对所处的建筑物内环境不熟悉,加上心理紧张,不知所措,常常没有目标的盲目从众跟随,而由于这种行为,很容易造成疏散通道及出口拥堵,同时有的通道及出口空闲。
在这种情况下,利用经验知识进行合理的引导是非常重要的。在人群疏散过程中,如果有熟悉场景的人员及合理的疏散策略引导,并且在疏散过程中及时传播信息,根据疏散通道及出口的拥挤度动态调整策略,引导人群朝着正确的疏散通道疏散,是非常重要的。
在实现本公开的过程中,发明人发现现有技术中存在以下技术问题:
传统的强化学习方法无法解决状态空间过大导致的维数灾难问题;
传统的建筑物内人群疏散仿真方法,速度慢,稳定性差,不能满足快速准确的人群疏散仿真需求。
发明内容
本公开的目的就是为了解决上述问题,提供基于共享深度强化学习的建筑物内疏散仿真方法及系统。
为了实现上述目的,本公开采用如下技术方案:
第一方面,本公开提供了基于共享深度强化学习的建筑物内疏散仿真方法;
基于共享深度强化学习的建筑物内疏散仿真方法,包括:
从视频中实时获取建筑物内的环境信息,实时采集人群分布信息;
搭建人群疏散双层控制机制,上层空间是管理Agent、多个导航Agent及知识库,下层空间是引领者及待分组的人群;
对待分组的人群进行分组,每组人群选出一个引领者,每组的引领者与对应的导航Agent连接,每个导航Agent均与管理Agent连接;
各导航Agent引导各组疏散,所有的导航Agent均把实时采集的信息及自身的经验池存储到管理Agent管理的知识库中;
管理Agent对知识库中的所有导航Agent的疏散信息,基于共享的深度强化学习算法进行学习,将通过学习产生的指导各导航Agent进行路径选择的策略实时发送给导航Agent;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010175498.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于环境治理的高能电子束反应装置
- 下一篇:一种复合式强切削单牙轮钻头