[发明专利]一种基于深度强化学习的地铁站空调系统节能控制方法有效
| 申请号: | 202110333881.9 | 申请日: | 2021-03-29 |
| 公开(公告)号: | CN113283156B | 公开(公告)日: | 2023-09-15 |
| 发明(设计)人: | 魏东;焦焕炎;冉义兵;冯浩东 | 申请(专利权)人: | 北京建筑大学 |
| 主分类号: | G06F30/27 | 分类号: | G06F30/27;F24F11/46;G06N3/008;G06N3/045;G06N3/08;G06F119/08 |
| 代理公司: | 成都瑞创华盛知识产权代理事务所(特殊普通合伙) 51270 | 代理人: | 邓瑞;辜强 |
| 地址: | 100044*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 强化 学习 地铁 空调 系统 节能 控制 方法 | ||
1.一种基于深度强化学习的地铁站空调系统节能控制方法,其特征在于:通过以下步骤实现:
S1、采集地铁站空调系统数据参数;
S2、对采集的数据进行滑动平均滤波处理、归一化和反归一化处理并利用线性函数转换方法将数据转换成0-1范围内的数值;
S3、利用神经网络和步骤S2获得的数据构建地铁站空调系统的神经网络模型;
S4、确定DDPG智能体的状态变量、动作变量、奖励信号以及结构;
S5、利用多步预测的DDPG算法求解最后的控制策略;
所述神经网络具有一个输入层、一个隐含层和一个输出层,所述隐含层的节点数为10;
所述输出层输出的为下一时刻系统能效比EER[k+1]和站台温度Tin[k+1];
所述DDPG智能体的状态变量S=[Tout,RHout,L,EER,Tin];
DDPG智能体的动作变量A=[Tchws,fpumpch,fpumpc,ft,ffan,d];
DDPG智能体的奖励信号:R=-|Tin-Tin_set|+eEER/100,其中,Tin_set代表站台温度设定值,eEER表示系统能效比的指数函数;
DDPG智能体结构包括Actor网络和Critic网络,且Actor网络和Critic网络均由3层的全连接层网络构成;
所述多步预测的DDPG算法包括Actor当前网络π(s,θ)、Critic当前网络q(s,a,w)、Actor目标网络π′(s,θ′)以及Critic目标网络q′(s,a,w′),其中,具体算法如下:
step1:随机初始化参数θ、w、θ′=θ、w′=w;清空经验回放池D;
step2:初始化状态S;
step3:基于Actor当前网络π(s,θ)生成n组动作Ai=π(S,θ)+ξ(i=1,2,...,n);
step4:利用系统模型,执行Ai(i=1,2,...,n),并向前预测p步,产生p个未来时刻的状态、动作和奖励值;
step5:计算每一组的总奖励值Rtotal(Ai),共n个,令A=argmax(Rtotal(Ai));
step6:执行动作A,得到下一时刻状态S′和奖励R;
step7:将{S,A,R,S′}这个四元组存入经验回放池D;
step8:S←S′;
step9:从集合D中随机采样m个样本,{Sj,Aj,Rj,S′j}j=1,2,...,m,根据计算式yj=Rj+γq′(S′,π′(S′,θ′),w′)计算当前目标值yj;
step10:根据计算式计算计算均方差损失函数J(w),更新
step11:根据计算式计算计算损失函数J(θ),更新θ:
step12:如果N%C=1,根据计算式w′←τw+(1-τ)w′和θ′←τθ+(1-τ)θ′更新目标网络参数;
step13:若S是非终止状态,转step3;S不是非终止状态,转下一步;
step14:若迭代次数小于N,转step2,若不小于N,结束;
其中,θ为Actor当前网络参数;θ′为Actor目标网络参数;w为Critic当前网络参数;w′为Critic目标网络参数;A为智能体施加给环境的动作;ξ为随机高斯噪声;D为经验回放池集合;m为批量梯度下降的样本数;C为目标网络参数更新频率;N为最大迭代次数;步长αθ>0,αw>0;γ为折扣因子,τ为软更新系数;n为预测组数;p为预测步数。
2.根据权利要求1所述的一种基于深度强化学习的地铁站空调系统节能控制方法,其特征在于,所述地铁站空调系统数据具包括:
室外温度Tout[k];
室外相对湿度RHout[k];
系统负荷L[k];
系统能效比EER[k];
站台温度Tin[k];
冷冻水供水温度Tchws[k];
冷冻水泵流量fpumpch[k];
冷却水泵流量fpumpc[k];
冷却塔风机电压ft[k];
末端风机频率ffan[k];
冷冻水阀开度d[k];
其中:k表示当前时刻。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京建筑大学,未经北京建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110333881.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自散热型变电柜柜体
- 下一篇:一种往复走丝电火花线切割恒张力上丝装置





