[发明专利]基于势博弈的微电网能量管理分布式多目标协同优化算法有效
申请号: | 201810028818.2 | 申请日: | 2018-01-12 |
公开(公告)号: | CN108347062B | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 曾君;王侨侨;刘俊峰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | H02J3/38 | 分类号: | H02J3/38;H02J3/32;H02J3/46;G06N3/00;G06N3/12;G06Q10/04;G06Q50/06 |
代理公司: | 44245 广州市华学知识产权代理有限公司 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 博弈 微电网 多目标 求解 协同优化算法 能量管理 收益函数 多目标优化算法 多目标建模 多目标优化 分布式特性 微电网元件 系统可靠性 博弈理论 单元建模 决策变量 决策优化 决策主体 向量函数 整体利益 势函数 最大化 迭代 建模 算法 进化 均衡 决策 保证 管理 合作 | ||
1.基于势博弈的微电网能量管理分布式多目标协同优化算法,其特征在于,包括以下步骤:
1)微电网元件单元建模
考虑一个典型的微电网,包括光伏阵列PV/pv、风力发电机WT/wt、柴油发电机DE/de、蓄电池BA/ba、负荷LD/ld以及电动汽车EV/ev,每个元件结合相应的功率变化器、传感器、控制器和智能开关构成可控的元件单元;每个元件单元均配备一个本地管理器LM,用于本地决策和本地管理,并且所有LM通过网络互联,相互之间能够通信以实现分布式协调控制;
1.1)决策主体与决策变量
所有元件单元组成的决策主体集合N表示如式(1);
式中,n1对应光伏阵列集合PV的数量,pvn是第n组光伏阵列,n=1,2,…,n1;n2对应风力发电机集合WT的数量,wtn是第n台风力发电机,n=1,2,…,n2;n3对应柴油发电机集合DE的数量,den是第n台柴油发电机,n=1,2,…,n3;n4对应蓄电池集合BA的数量,ban是第n组蓄电池,n=1,2,…,n4;n5对应负荷集合LD的数量,ldn是第n个负荷,n=1,2,…,n5;n6对应电动汽车集合EV的数量,evn是第n辆电动汽车,n=1,2,…,n6;
假定待优化的时间窗口包含TN个优化时段,元件单元i在t时段的输出功率或消耗功率即决策变量用Pit表示,i∈N,t=1,2,…,TN,用正值表示输出功率,负值表示消耗功率;元件单元i的决策向量Pi表示如式(2);
Pi=[Pi1,Pi2,…,Pit,…,PiTN]T,i∈N (2)
1.2)元件约束
决策变量Pit受上下限约束,如式(3)所示;
元件单元i在t时段的功率上下限分别为Pti·max和Pti·min;同时,元件单元所受的其它约束gi(Pi)如式(4)所示;
gi(Pi)≤0,i∈N (4)
所有元件单元必须满足功率平衡约束,如式(5)所示;
1.3)多目标建模
多目标函数考虑两类:自利目标与协同目标;
自利目标指的是仅与自身决策向量相关而与其它元件单元决策向量无关的目标,且该目标表明元件单元追逐自身利益最大化;此类目标数量至少一个,设以元件单元i的收益和污染物即废弃物排放为两个目标,最大化收益目标为Fi1(Pi,ρ,γi),ρt为t时段的单位电价,t=1,2,…,TN,ρ为电价向量;γit为t时段的单位成本系数,t=1,2,…,TN,γi成本系数向量,如式(6)所示;
最小化污染物排放目标为Fi2(Pi,μi),μit为t时段的废弃物排放系数,t=1,2,…,TN,μi为排放系数向量,如式(7)所示;
因ρ、γi和μi为非决策向量,在不产生误解的情况下,Fi1(Pi,ρ,γi)和Fi2(Pi,μi)分别简写为Fi1(Pi)和Fi2(Pi);
协同目标指的是决策主体之间共同拥有的目标,通过相互间的信息共享实现,表征决策主体之间的互动和影响;协同目标的数量至少有一个,每个协同目标至少包含两个决策主体;设以光伏-风机-负荷m个决策主体的协同为目标,目的是使负荷与可再生能源出力相一致以减小其波动性对微电网的影响,元件单元i的协同目标为Fi(j,k)(Pi,Pj,Pk),元件单元j的协同目标为Fj(i,k)(Pj,Pi,Pk),元件单元k的协同目标为Fk(i,j)(Pk,Pi,Pj),i,j和k分别代表光伏元件、风机元件和负荷,如式(8)所示;
此m个决策主体具有相同的协同目标形式F(i,j,k)(Pi,Pj,Pk),如式(9)所示;
式中,avgτ(Pi,Pj,Pk)为从时段τ开始的Nw时间窗内i、j与k的决策变量的平均值,Nw为滑动时间窗的长度;
2)势博弈建模
以所有决策主体作为博弈局中人,局中人集合如式(1)所示;以元件单元i的决策向量Pi作为局中人的策略,如式(2)所示;满足式(3)、(4)的所有决策向量Pi的集合为局中人i的策略集即策略空间Yi,如式(10)所示;
局中人i的效用函数Ui(Ps)s∈N即支付函数是一个向量函数,Ps指对局中人i的效用函数产生影响的决策向量,如式(11)所示;
max Ui(Ps)s∈N=[Fi1(Pi),-Fi2(Pi),-Fi(j,k)(Pi,Pj,Pk)] (11)
所有局中人的效用函数必须具有相同维数,但每个局中人的优化目标数量可能不同,解决的方式是:将所有优化目标分类,包括经济性目标即收入、环境性目标即污染物排放和光伏-风机-负荷协同目标,在效用函数向量中依次排列,同种类型目标即具有相同量纲的放置在相同的位置,若无该类型目标则以0补齐;统一所有目标的形式,所有最小化目标按最大化其相反数处理,也能够用同样方法将所有目标转化成最小化处理;
存在势函数G(Ps)s∈N,如式(12)所示,满足势博弈定义;
至此,建立分布式多目标协同优化的势博弈模型;
3)基于多目标优化算法的分布式博弈求解
博弈求解通过以下步骤实现:
3.1)策略评估
直接使用效用函数评估策略,效用函数是一个向量函数,每个分量为一个优化目标,采用多目标优化算法求解出pareto最优解集作为候选策略集;所述的多目标优化算法包括多目标粒子群算法即MOPSO算法和多目标遗传算法即NSGA、NSGA-II和NSGA-III这些多目标进化类算法及其改进形式;
3.2)决策规则
局中人需要从候选策略集中选出一个策略作为下一步的策略,考虑全局功率平衡约束即式(5),确立如下原则:①可行解优先于不可行解;②可行解中非支配解优先;③不可行解中约束违背量小的解优先;
所述的约束违背量是指t时段的功率平衡约束违背量ΔPt如式(13)所示;
式中,ε是误差限,接近0的正数;所述的可行解满足式(13),反之为不可行解;
根据以上原则,有两种方式选择策略;方式一:随机选择,从候选策略集中随机选择一个策略作为下一步的策略;方式二:将效用函数的各个分量即归一化线性加权组合得到决策函数Fi(Pi),使决策函数取最大值的策略Pi*作为下一步的策略,如式(14)所示,αi1,αi2和βi(j,k)分别为对应目标函数Fi1(Pi),Fi2(Pi)和Fi(j,k)(Pi,Pj,Pk)的加权系数;
3.3)调整机制,即策略更新
调整机制分为静态调整和动态调整;
所述的静态调整指的是所有局中人选定下一步的策略后并不立即更新自己的策略,待所有局中人结束本轮博弈之后再更新策略;局中人通过通信获得的其他局中人的策略均是上一轮博弈所确定的策略;
所述的动态调整指的是局中人确定下一步策略之后立即更新自己的策略,局中人通过通信获得的其他局中人的策略均是最新的策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810028818.2/1.html,转载请声明来源钻瓜专利网。