[发明专利]基于深度强化学习的含氢储能微网优化运行方法有效
| 申请号: | 202110471604.4 | 申请日: | 2021-04-29 |
| 公开(公告)号: | CN113095715B | 公开(公告)日: | 2022-07-05 |
| 发明(设计)人: | 朱振山;翁智敏;叶成涛;陈哲盛;郑海林;吴诗雨 | 申请(专利权)人: | 福州大学 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06N3/04;G06N3/08;G06F30/20 |
| 代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 丘鸿超;蔡学俊 |
| 地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 强化 学习 含氢储能微网 优化 运行 方法 | ||
1.一种基于深度强化学习的含氢储能微网优化运行方法,其特征在于:利用线性插值法建立电解槽效率特性模型,并将电解槽效率特性模型与微型燃气轮机、电化学储能、储氢罐和燃料电池模型相结合,以最小化微网运行成本为目标,构建含氢储能微网优化运行模型;并采用深度确定性策略梯度算法求解微网优化运行决策问题,包括以下步骤:
步骤S1:计算电解槽效率与输入功率,获取电解槽效率特性数据,利用查表线性插值的方法构建电解槽效率特性模型,具体包括:
步骤S11:计算电解槽效率特性:
电解槽效率ηel由电压效率ηv和电流效率ηi两部分组成:
ηel=ηiηv
ηv=(Utn/Uel)*100%
式中:I为电解槽的堆栈电流;Utn为理论分解电压;Uel为电解电压;
其中,电解电压由以下式子算出:
Urev(T,p)=1.5184-1.5421×10-3T+9.523×10-5TlnT+9.84×10-8T2
Uohm=IRi
式中:T为电解槽工作温度;Urev为电解水的可逆电压;Uohm为电解质自身电阻产生的电阻压降;依次为电解水产生的氢超电势、氧超电势;Ri为电解质电阻;R为普适气体常数,F为法拉第常数;αc为阴极的电荷传递系数,αa为阳极的电荷传递系数;jco为阴极的交换电流密度,jao为阳极的交换电流密度;nc为阴极的电子转移数,na分别为阳极的电子转移数;
电解槽输入功率由以下式子算出:
Pel=UelI;
步骤S12:构建基于查表线性插值法的电解槽效率特性模型:
取若干个计算出的功率效率数据对作为原始数据,形成数据表;通过查表以及线性插值的方式求出对应的电解槽效率:
式中,P0、P1分别为查表时数据表中离Pel最近的两个功率;η0为P0在数据表中对应的电解槽效率,η1为P1在数据表中对应的电解槽效率;
步骤S2:以最小化微网运行成本为目标,构建由光伏发电装置、微型燃气轮机、电化学储能以及电解槽、储氢罐和燃料电池组成的氢储能系统的含氢储能微网优化运行模型;
步骤S3:利用深度确定性策略梯度算法优化微网运行成本,具体包括:
步骤S31:确定状态空间和动作空间:
微网优化运行的状态空间参数包括光伏实时发电功率PtPV、实时用电负荷Ptload、电化学储能的实时荷电状态氢储罐的储氢状态
式中,st表示t时刻微网状态;
电化学储能充放电功率通过SOC约束和额定功率算出;
微网运行优化的动作空间用微型燃气轮机出力PtMT和氢储能系统充放电功率表示:
式中,at表示t时刻动作;
步骤S32:设计奖励值:
将约束条件转换为奖励函数的一部分:
D2=2(Ptcurt+Ptloss)
rt=-Ft-D2+D1
其中:
Cbat(t)=cbat|Ptb|
Cel(t)=celPtel
Cfc(t)=cfcPtfc
式中,D1为氢储能SOC罚函数;表示氢储能SOC的上限,表示氢储能SOC的下限,D2表示失负荷和弃光成本;Ptcurt为t时刻弃光功率,Ptloss为t时刻失负荷功率;rt为t时刻奖励,Ft为t时刻微网运行成本;CMT(t)为t时刻微型燃气轮机的运行成本;为t时刻微型燃气轮机的CO2排放成本;Cbat(t)为电化学储能的运维成本,Cel(t)为电解槽的运维成本,Cfc(t)为燃料电池的运维成本;cbat为电化学储能的运维成本系数,cel为电解槽的运维成本系数,cfc为燃料电池的运维成本系数;为燃气轮机CO2排放系数;为碳交易市场碳排放价格;Ptb为t时刻电化学储能的充放电功率;Ptel为t时刻电解槽功率、Ptfc为t时刻燃料电池功率;
步骤S33:利用深度确定性策略梯度算法优化微网运行成本:
首先确定迭代次数和调度周期长度,初始化深度确定性策略梯度算法超参数,然后,选择微网初始状态,根据策略网络选择动作并叠加噪声,根据动作计算电化学储能功率,执行动作,观察当前奖励,并将当前状态、动作、奖励、下一时刻状态存储至经验池;最后,选取样本,根据更新公式更新策略网络和评价网络及目标网络并更新状态,重复至调度周期结束,开始下一轮迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110471604.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种量子化生物种群数量估计方法
- 下一篇:一种粗糠树组织培养快速生根的方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





