[发明专利]基于强化学习的室内热环境学习效率提升的优化控制方法有效
| 申请号: | 202210279251.2 | 申请日: | 2022-03-22 |
| 公开(公告)号: | CN114370698B | 公开(公告)日: | 2022-06-24 |
| 发明(设计)人: | 李岩学;王子璇;李珊珊;徐阳;高伟俊 | 申请(专利权)人: | 青岛理工大学 |
| 主分类号: | F24F11/63 | 分类号: | F24F11/63;F24F11/46;F24F11/89 |
| 代理公司: | 青岛海昊知识产权事务所有限公司 37201 | 代理人: | 刘艳青 |
| 地址: | 266000 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 强化 学习 内热 环境 效率 提升 优化 控制 方法 | ||
1.一种基于强化学习的室内热环境学习效率提升的优化控制方法,其特征在于,该方法包括以下步骤:
S1:获取观测数据:包括获取室内外热环境和人体的相关参数;室内外热环境数据:时刻信息,室外温度,室外相对湿度,太阳辐射强度,空调系统耗电量,和室内温度;
S2:搭建神经网络模型,使用该模型迭代预测下一时刻的室内温度值、空调耗电量、脑电波;
S3:利用S1获取的数据在S2建立的模型中进行循环运算,并引入DQN强化学习方法,基于神经网络训练控制空调体统的智能体,通过对当前状态值的观测以及得到的奖励,自动学习空调系统控制制热量决策的优化过程,得到最优控制策略,即得到最优的控制方法;
所述S2中,搭建神经网络模型:选用三层前馈全连接神经网络:一个输入层、一个隐含层、一个输出层,建立系统的输入输出模型;选择均方差作为神经网络建模的损失函数;优化器选择随机梯度下降法来寻找模型最优解;最终选择时刻信息,室外温度,室外相对湿度,太阳辐射强度,空调系统耗电量,室内温度,皮肤温度,前一分钟时段内脑电波的平均值,作为模型的输入层参数,
所述S3中,将控制方法运行优化问题建模为马尔科夫决策过程;奖励函数
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛理工大学,未经青岛理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210279251.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轻量化机器人手臂及其制备方法
- 下一篇:一种氨气合成用催化剂的制备方法





