[发明专利]一种自增强学习的撮合竞价方法及系统在审
申请号: | 201710914516.0 | 申请日: | 2017-09-29 |
公开(公告)号: | CN107644370A | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | 程海花;郑亚先;薛必克;耿建;杨争林;邵平;龙苏岩;郭艳敏;王高琴;史新红;吕建虎;徐骏;黄春波;陈爱林;曾丹;叶飞;张旭;王秀丽;祁天星;张炜 | 申请(专利权)人: | 中国电力科学研究院;国家电网公司;国网江苏省电力公司;西安交通大学 |
主分类号: | G06Q30/08 | 分类号: | G06Q30/08;G06Q50/06 |
代理公司: | 北京安博达知识产权代理有限公司11271 | 代理人: | 徐国文 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 增强 学习 撮合 竞价 方法 系统 | ||
1.一种自增强学习的撮合竞价方法,其特征在于,所述竞价方法包括:
采集所有售电商的报价,其中设定待测售电商报价为初始竞价,剩余其他售电商报价设定为初始售电商报价;
基于预先设定的步长分别调整初始售电商报价和初始竞价构成售电商报价和竞价报价;
基于所述初始售电商报价、初始竞价、竞价报价和售电商报价得到收益;
基于预先设定的步长重新调整电商报价和竞价报价继续计算收益,直到达到预先设定的学习报价轮数阈值;
基于所有的售电商报价、竞价报价和收益确定最终竞价报价。
2.如权利要求1所述的一种自增强学习的撮合竞价方法,其特征在于,所述采集所有售电商的报价,其中待测售电商报价为初始竞价,剩余其他售电商报价作为初始售电商报价包括:
采集所有售电商的报价构建集合S,S={s1,s2,…,sn},其中s1,s2,…,sn为所有售电商报价;
设定待测售电商报价at,at∈S;
设定初始售电商报价为st,st∈S-at。
3.如权利要求1所述的一种自增强学习的撮合竞价方法,其特征在于,所述基于预先设定的步长调整所述竞价报价包括:
以小概率的ε‐greedy算法随机选择报价;
所述ε-greedy算法按下式计算:
ε=tempt
式中:temp:小于1的衰减系数;t:当前学习报价轮数。
4.如权利要求1所述的一种自增强学习的撮合竞价方法,其特征在于,所述基于预先设定的步长调整所述售电商报价如下式:
式中:pi,t:售电商i在t轮学习中的模拟报价;stepi:售电商i的竞价风险调整步长;Gaini:报价的函数,表征售电商i参与匹配的收益;其他:不满足调价条件的情况;t:当前学习报价轮数。
5.如权利要求4所述的一种自增强学习的撮合竞价方法,其特征在于,所述售电商i的竞价风险调整步长stepi基于概率θt计算;
以概率θt选择所述步长stepi,以概率1‐θt选择原步长stepi;
所述概率θt的计算式如下:
θt=θ0t
式中:θ0:报价调整概率且0<θ0<1。
6.如权利要求1‐5任一项所述的一种自增强学习的撮合竞价方法,其特征在于,所述基于初始售电商报价、初始竞价报价、新的竞价报价和新的售电商报价采用Q‐learning算法得到收益由下式计算:
Q'(at,st)=(1-α)Q(at,st)+αγmaxQ(a't+1,s't+1)
式中:α:学习率且0<α<1;γ:时间贴现率且0<γ<1;maxQ(a't+1,s't+1):新状态下的最大收益值;a't+1:新状态下的最优策略;Q(at,st):收益;Q'(at,st):新状态的收益;t:当前学习报价轮数。
7.如权利要求6所述的一种自增强学习的撮合竞价方法,其特征在于,所述学习报价轮数阈值设定为1000。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院;国家电网公司;国网江苏省电力公司;西安交通大学,未经中国电力科学研究院;国家电网公司;国网江苏省电力公司;西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710914516.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种拱形支挡结构
- 下一篇:一种具有排水功能的红砂岩边坡