[发明专利]一种基于多智能体强化学习的多微网系统协同优化方法在审
申请号: | 202210178581.2 | 申请日: | 2022-02-24 |
公开(公告)号: | CN114611772A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 刘俊峰;王晓生;曾君;卢俊菠 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/08;G06Q50/06 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 周春丽 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 智能 强化 学习 多微网 系统 协同 优化 方法 | ||
1.一种基于多智能体强化学习的多微网系统协同优化方法,其特征在于,包括以下步骤:
分别建立微网中各设备的数学模型,这些模型用于描述各设备的工作原理;
建立多微网协同优化宏观模型来描述微网之间的博弈关系,包括构建微网的目标函数以及多微网系统运行的约束条件;
采用改进的Nash-Q学习算法来求解纳什均衡,其中,Nash-Q学习算法的改进包括:采用深度神经网络来拟合Nash-Q学习算法中的价值函数,离线训练时从存储在经验池中的多个微网与环境交互得到的状态转移样本中随机抽取样本进行训练,且建立用于评估当前状态动作对的价值函数的当前值网络和用于评估目标状态动作对价值函数目标值网络,在离线训练时只更新当前值网络的参数,目标值网络参数保持不变,但每隔预设次数迭代后将各个微网的当前值网络参数复制给相应的目标值网络;
将当前时刻的状态信息输入到当前值网络即可得到纳什Q值,再通过迭代搜索法即可得到纳什均衡动作。
2.根据权利要求1所述的一种基于多智能体强化学习的多微网系统协同优化方法,其特征在于,微网内部存在冷、热、电三种用户负荷,其设备包括燃气轮机、余热回收锅炉、燃气锅炉、换热装置、电制冷机、蓄电池、风机和光伏电池。
3.根据权利要求1所述的一种基于多智能体强化学习的多微网系统协同优化方法,其特征在于,对于单个微网,它的优化目标是最小化优化周期的运行成本,而运行成本表达式如下:
式中:T为一天划分的时段数;Ci为微网i的日运行成本,COM,i(t)为t时段微网i的设备运行维护成本、CNG,i(t)为t时段微网i的购买天然气成本、CMG,i(t)为t时段微网i与其它微网的交互成本、Cg,i(t)为t时段微网i与电网的交互成本;
且在纳什均衡处,微网i运行成本满足:
式中:ai表示微网i的策略,分别表示微网i的纳什均衡策略以及除微网i外其他微网的纳什均衡策略组合。
4.根据权利要求1所述的一种基于多智能体强化学习的多微网系统协同优化方法,其特征在于,多微网系统运行的约束条件包括各设备的局部约束、微网内部的冷热电能量平衡约束和微网之间的电能交互量平衡约束。
5.根据权利要求4所述的一种基于多智能体强化学习的多微网系统协同优化方法,其特征在于,微网内部的冷热电能量平衡约束包括电力总线能量平衡约束、热力总线能量平衡约束和冷却总线能量平衡约束,其中:
电力总线能量平衡约束为:
热力总线能量平衡约束为:
QGB,i(t)+QHX,i(t)=Lh,i(t)
冷却总线能量平衡约束为:
PEC,i(t)ηEC=Lc,i(t)
式中:PGT,i(t)为t时段微网i的燃气轮机的发电功率,PB,i(t)为t时段微网i的蓄电池的功率,Pg,i(t)为微网i与电网的交互电功率,正值表示购电,负值表示售电,PPV,i(t)为t时段微网i的光伏发电功率,PWT,i(t)为t时段微网i的风机发电功率,Le,i(t)为t时段微网i的电负荷,PEC,i(t)为t时段微网i的电制冷机消耗的电功率,QGB,i(t)为t时段微网i的燃气锅炉的输出热功率,QHX,i(t)为t时段微网i的换热装置的输出热功率,Pij(t)为t时段微网i与微网j的实际交互电功率,正值表示购电,负值表示售电,ηEC为电制冷机的性能系数,Lh,i(t)为t时段微网i的热负荷,Lc,i(t)为t时段微网i的冷负荷。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210178581.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种立式留声机用唱片智能防护装置
- 下一篇:微光学列阵元件
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理