[发明专利]一种发电侧成员动态报价决策方法、装置及设备有效
申请号: | 201910287392.7 | 申请日: | 2019-04-09 |
公开(公告)号: | CN110111135B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 赵唯嘉;王宁;梁志远;王宣定;孔淑琴;赖晓文;张元;王鹏 | 申请(专利权)人: | 广东电力交易中心有限责任公司 |
主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06Q50/06 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文;麦小婵 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 发电 成员 动态 报价 决策 方法 装置 设备 | ||
本发明公开了发电侧成员动态报价决策方法、装置及设备,方法包括S1、生成各发电成员的强化学习初始策略空间,并对每一报价策略的选择概率进行初始化;S2、选定选择概率最大的报价策略;S3、利用出清模型得到市场出清结果;S4、基于对角化优化机制生成局部最优策略空间;S5、通过强化学习方法计算每一报价策略的评价函数值并修正报价策略的选择概率;S6、当不满足强化学习终止条件时重新执行步骤S2;S7、当判定评价函数值满足强化学习终止条件时,输出最优报价策略。本发明解决出现具有纳什均衡的市场中出清结果偏离纳什均衡点的问题,同时引入对市场发电成员的分析,以更加贴近市场发电成员的真实地决策过程。
技术领域
本发明涉及电力市场技术领域,尤其是涉及一种发电侧成员动态报价决策方法、装置及设备。
背景技术
集中竞价市场每日都会出清,市场成员在交易中会积累大量的信息,为发电成员不断尝试报价提供了条件。在日前市场中,发电成员会根据历史的报价和收益不断调整自身的报价策略。针对电力市场交易的模拟一方面要建立集中竞价出清模型,以模拟市场的出清过程,另一方面需要从发电成员的行为模拟出发,研究其报价决策模型,从而分析发电成员个体决策如何在整体上影响市场的均衡。
各个发电成员是差别化的,采用Multi-Agent结构对发电成员进行建模时,核心在于研究发电成员的报价决策模型。在对现有技术的调查研究过程中,本发明的发明人发现,现有技术都采用强化学习方法模拟市场成员不断学习报价决策的过程,强化学习方法与发电成员的认识市场的过程是类似的,其学习机制能够有效模拟真实市场的建立和发展过程。
强化学习方法的策略集空间是固定且有限的,策略集只能在不连续的空间内选择,且强化学习的评价函数是完全经验的模型,不包括对于真实市场的特点的认识,进行对利润信号的强化会隐含地削弱成发电成员决策对于风险因素考虑,目前尚未有丰富策略空间及考虑市场成员对市场的认知和分析的研究开展。
因而仅采用强化学习方法其智能程度要弱于真实市场个体,当市场存在纳什均衡时强化学习方法会使得市场均衡稳定在长期合作博弈的均衡点,这违背真实市场的规律。
发明内容
本发明提供了一种发电侧成员动态报价决策方法、装置及设备,以解决出现具有纳什均衡的市场中出清结果偏离纳什均衡点的问题,同时引入对市场发电成员的分析,以更加贴近市场发电成员的真实地决策过程。
第一方面,本发明实施例提供一种发电侧成员动态报价决策方法,至少包括以下步骤:
S1、根据输入的电力市场交易信息生成各发电成员的强化学习初始策略空间,并对所述初始策略空间中的每一报价策略的选择概率进行初始化;
S2、选定选择概率最大的报价策略;
S3、利用集中竞价市场的出清模型对报价数据进行优化并得到市场出清结果,其中,所述市场出清结果包括各发电成员的中标电量和出清价格;
S4、基于对角化优化机制分析各发电成员的报价决策机理,并根据历史数据分析得到各发电成员本次报价的局部最优策略空间;
S5、通过强化学习方法计算得到所述局部最优策略空间中的每一报价策略的评价函数值并修正报价策略的选择概率,根据评价函数值的大小顺序映射报价策略的选择概率值;
S6、当所述评价函数值不满足强化学习终止条件时,重新执行步骤S2;
S7、当判定所述评价函数值满足强化学习终止条件时,输出最优报价策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电力交易中心有限责任公司,未经广东电力交易中心有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910287392.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于关联模式的活动创建方法及装置
- 下一篇:一种通过交通工具推送广告的方法