[发明专利]一种基于多智能体深度强化学习的协作充电规划方法在审
申请号: | 202211462417.0 | 申请日: | 2022-11-21 |
公开(公告)号: | CN115907377A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 冯勇;王蜀蒙;李英娜;张晶;付晓东 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06Q10/0631 | 分类号: | G06Q10/0631;G06Q50/06;G06F18/241;G06N3/04;G06N3/084 |
代理公司: | 昆明明润知识产权代理事务所(普通合伙) 53215 | 代理人: | 马海红 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 智能 深度 强化 学习 协作 充电 规划 方法 | ||
本发明公开了一种基于多智能体深度强化学习的协作充电规划方法,属于无线可充电传感器网络(WRSN)领域。在大规模或密集型WRSN中使用多个移动充电器(MC)可避免对传感器节点充电不及时造成的节点能量耗尽。由于节点不均匀分散分布且充电时间不同,多MC需异步充电,故以往多智能体深度强化学习算法难以用于多MC协同充电的场景。本发明基于多智能体深度强化学习优化WRSN中多MC协作调度问题,即提出一种多MC异步充电的框架,并使用协作通信单元为每个决策智能体动态地提取其他智能体信息。本发明旨在使多MC可以更好的协作,从而在保证最小死亡节点数的前提下,使各个MC的移动路径长度最短,最大化多MC的充电效用。
技术领域
本发明涉及无线可充电传感器网络领域,具体涉及一种基于多智能体深度强化学习的协作充电规划方法(MACC)。
背景技术
能量约束问题一直是限制无线传感器网络发展的重要因素之一。无线可充电传感器网络(Wireless Rechargeable Sensor Network,WRSN)是一种在受能量约束的无线传感器网络中部署移动充电器(Mobile Charger,MC)为传感器充电的无线传感器网络。如今,WRSN已广泛应用于军事、农业生产、森林防火、生态监测等多个领域。而有效地规划MC的充电路径进而延长WRSN的生存时间成为了WRSN的关键性研究问题。
在大规模或密集型无线可充电传感器网络中使用多个MC可以尽可能避免由于对传感器节点充电不及时造成的传感器节点能量耗尽。仅使用单智能体深度强化学习方法难以满足多MC协作的需求。而由于每个传感器节点不均匀分散分布且充电所需的时间不同,多MC需执行异步充电,所以以往多智能体深度强化学习算法的结构难以适用于多MC协同充电的场景。针对上述问题,研究可满足多MC异步协作的多智能体深度强化学习协作充电规划方法,可以大大提高多MC的充电效率。
Meiyi Yang等学者于2020年在IEEE Internet Of Things Journal发表的“Dynamic Charging Scheme Problem With Actor-Critic Reinforcement Learning”提出了基于行动者-评论家强化学习(ACRL)算法的WRSN新型动态充电方案(DCS)。方法利用单智能体深度强化学习为一个MC动态的选择充电节点,并在节点平均寿命和MC移动路径长度方面的效果优于传统启发式方法。但一个MC无法满足大规模或密集型无线可充电传感器网络的充电需求。
Yuxin Chen等学者于2021年在IEEE International Conference on Sensing,Communication,and Networking发表的“VarLenMARL:A Framework of Variable-LengthTime-Step Multi-Agent Reinforcement Learning for Cooperative Charging inSensor Networks”提出了一个新的多智能体深度强化学习框架,称为VarLenMARL。VarLenMARL中的训练样本收集机制使用其他MC旧的信息为决策MC进行动作决策,从而允许每个MC在估计奖励之前在可变长度的时间步完成一个动作。这解决了多MC需执行异步充电的问题。但导致如下问题:决策智能体必须花费更多的时间才能从训练样本中找到有用的信息。智能体正常训练过程受到这些旧数据的干扰,变得不稳定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211462417.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理