[发明专利]基于日内多目标强化学习的梯级电站离线调度方法及系统在审
申请号: | 202210661809.3 | 申请日: | 2022-06-13 |
公开(公告)号: | CN115018328A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 罗玮;顾发英;朱阳;黄志峰;张铮 | 申请(专利权)人: | 国能大渡河大数据服务有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06K9/62;G06Q50/06;H02J3/46 |
代理公司: | 成都启慧金舟知识产权代理事务所(特殊普通合伙) 51299 | 代理人: | 何媛 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 日内 多目标 强化 学习 梯级 电站 离线 调度 方法 系统 | ||
本发明公开了基于日内多目标强化学习的梯级电站离线调度方法及系统,涉及电力系统调度技术领域,其技术方案要点是:根据日内调度场景对调度任务进行划分,得到战略任务以及兼顾任务;利用贝叶斯回归模型从日内调度的决策因子中预测未来来水和电力需求的概率分布;根据战略任务、兼顾任务和决策因子构建梯级电站调度的调度仿真系统;根据日内调度场景确定多目标的标准化回报函数,并将标准化回报函数加入调度仿真系统以实现对调度策略进行评价;根据调度策略的评价结果在调度仿真系统中训练调度策略,得到离线的调度优化模型;进行效果验证。本发明使得梯级电站的调度策略生成过程准确度较高,整体实现的可靠性较强。
技术领域
本发明涉及电力系统调度技术领域,更具体地说,它涉及基于日内多目标强化学习的梯级电站离线调度方法及系统。
背景技术
梯级电站群实时调度是电力调度系统中挑战性最大的问题,首先,实时调度影响因子较多,导致调度决策维度较大;其次,实时调度面临太多外部不确定性,决策模型必须考虑影响因子本身的不确定性;最后,实时调度需要模型即时反馈,当外部环境发生变化时,模型要迅速对其做出反映。
目前,现有的实时调度模型存在很多问题:1.为追求时间效率而大量简化模型,使得模型与实际差距较大,且很难达到最优;2.现有模型没有考虑到影响因子预测本身存在的不确定性,导致模型鲁棒性较差;3.现有模型需要定时更新寻优,计算资源耗费太大,时间效率太低;4.现有模型很难处理多任务调度场景,并且无法处理具有相互冲突的多目标问题。
因此,如何研究设计一种能够克服上述缺陷的基于日内多目标强化学习的梯级电站离线调度方法及系统是我们目前急需解决的问题。
发明内容
为解决现有技术中的不足,本发明的目的是提供基于日内多目标强化学习的梯级电站离线调度方法及系统,使得梯级电站的调度策略生成过程准确度较高,整体实现的可靠性较强。
本发明的上述技术目的是通过以下技术方案得以实现的:
第一方面,提供了基于日内多目标强化学习的梯级电站离线调度方法,包括以下步骤:
根据日内调度场景对调度任务进行划分,得到与日调度模型相互衔接的战略任务以及日内调度需要兼顾的兼顾任务;
利用贝叶斯回归模型从日内调度的决策因子中预测未来来水和电力需求的概率分布;
根据战略任务、兼顾任务和决策因子构建梯级电站调度的调度仿真系统;
根据日内调度场景确定多目标的标准化回报函数,并将标准化回报函数加入调度仿真系统以实现对调度策略进行评价;
根据调度策略的评价结果在调度仿真系统中训练调度策略,得到离线的调度优化模型;
对决策因子进行抽样,并依据抽样结果将调度优化模型输出的优化调度策略在调度仿真系统上进行效果验证,若优化调度策略符合规定,则将离线的优化调度策略部署到生产指挥系统。
进一步的,所述调度任务依据日内调度场景的分层结构进行划分,具体划分过程为:
日内调度场景任务分为第一级目标、第二级目标和第三级目标;
第一级目标包括依据日调度模型所决策出最优的每个电站的期末水位目标、每个电站的弃水目标以及调度中心下发的每十五分钟的负荷计划;
第二级目标包括保持日内出库平稳的日内安全目标和保持坝前水位平稳的日内坝前水位;
第三级目标包括机组少调和机闸少调。
进一步的,所述电力需求在未来决策时间段内服从联合正态分布,具体表达式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国能大渡河大数据服务有限公司,未经国能大渡河大数据服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210661809.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理