[发明专利]电网潮流调控决策推理方法有效
| 申请号: | 202110444680.6 | 申请日: | 2021-04-24 |
| 公开(公告)号: | CN113141012B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 杜友田;鹿永迪;王晨希;解圣源;郭子豪 | 申请(专利权)人: | 西安交通大学;国网浙江省电力有限公司 |
| 主分类号: | H02J3/06 | 分类号: | H02J3/06;G06F30/27;G06N3/045;G06N3/042;G06N3/084;G06N5/04;G06F113/04 |
| 代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
| 地址: | 710048*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 电网 潮流 调控 决策 推理 方法 | ||
1.一种基于深度确定性策略梯度网络的电网潮流调控决策推理方法,其特征在于,包括如下步骤:
步骤1,为电力网络设计其状态表征向量S和动作表征向量A;
步骤2,基于深度确定性策略梯度(DDPG)网络设计推理模型,将状态表征向量S作为Actor网络的输入,输出为一个具体的连续动作空间向量,称为连续动作A,将连续动作A通过映射规则映射到预定义好的离散动作空间,得到k个相似的离散动作Areal,与输入的状态表征向量S组成k组“状态-动作”对向量,将“状态-动作”对向量作为Critic网络的输入,输出每一“状态-动作”对向量的价值估计,选取估计值最高的动作作为该状态下要在环境中执行的最终动作;
步骤3,基于离散化的电网运行数据集仿真电网运行环境,将所述模型和仿真电网运行环境进行交互,收集经验样本数据,模型从仿真电网运行环境中得到当前状态和要执行的最终动作,将要执行的最终动作交由仿真电网运行环境执行,并反馈即时奖励、下一状态和是否结束信号;如果结束信号为真,则结束当前回合,重新初始化状态进行交互;否则,基于下一状态重复交互步骤;
步骤4,所述经验样本数据放入经验回放池,从经验回放池中采样经验样本数据,更新模型参数。
2.根据权利要求1所述基于深度确定性策略梯度网络的电网潮流调控决策推理方法,其特征在于,所述步骤1中,电力网络的状态空间和动作空间均由连续空间变量和离散空间变量组成;其中状态空间的连续空间变量包括时间、发电机发电功率和机端电压、负载功率、节点电压、线路潮流值以及电压,离散空间变量包括网络拓扑结构;动作空间的连续变量包括发电机出力调整和负载功率调整,离散变量包括传输线路通断状态和变电站节点内双母线与各元件的连接拓扑结构。
3.根据权利要求2所述基于深度确定性策略梯度网络的电网潮流调控决策推理方法,其特征在于,所述步骤1中,确定电力网络中包含的变电站节点、发电机节点、负载节点和传输线路数量,并进行编号,利用编号代表对应元器件,并将其对应变量放入具体位置构成一维的状态表征向量S;其中,发电机节点放入发电功率和机端电压变量,负载节点放入负载功率变量,变电站和传输线路通过编号连接代表拓扑结构。
4.根据权利要求2或3所述基于深度确定性策略梯度网络的电网潮流调控决策推理方法,其特征在于,所述发电机出力调整和负载功率调整的具体增/减功率值放入一维动作向量对应编号位置,通过1、0代表传输线路通/断状态切换动作,通过0、1、2代表变电站节点内各元器件与双母线的连接状态,0表示该元器件与所有母线断开,1代表该元器件与1号母线连接,2代表该元器件与2号母线连接,得到动作表征向量A。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;国网浙江省电力有限公司,未经西安交通大学;国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110444680.6/1.html,转载请声明来源钻瓜专利网。





