[发明专利]一种快速对抗深度置信网络的分布式多目标优化加速方法有效
| 申请号: | 202011189644.1 | 申请日: | 2020-10-30 | 
| 公开(公告)号: | CN112381271B | 公开(公告)日: | 2022-07-15 | 
| 发明(设计)人: | 殷林飞;徐紫东;高放 | 申请(专利权)人: | 广西大学 | 
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/06;H02J3/00;G06N3/08 | 
| 代理公司: | 南宁启创知识产权代理事务所(特殊普通合伙) 45122 | 代理人: | 谢美萱 | 
| 地址: | 530004 广西*** | 国省代码: | 广西;45 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 快速 对抗 深度 置信 网络 分布式 多目标 优化 加速 方法 | ||
1.一种快速对抗深度置信网络的分布式多目标优化加速方法,其特征在于,该方法提出优化加速方法和样本数据生成方法,即基于深度置信网络的调度优化决策加速方法和利用生成式对抗网络的样本数据生成方法;同时提出纳什博弈帕累托多目标优化方法,该方法在使用过程中的步骤为:
(1)提出纳什博弈帕累托多目标优化方法,综合考虑低成本、低碳排放和高舒适度三个目标进行优化,将得到的结果用来训练深度置信网络;
三个目标函数分别如下:
1)发电成本最小:
式中,n和m分别为微元网中火电机组和水电机组的数量,Pthi、Phyi、Pw和Ppv分别为火电、水电、风电和光伏所发出的有功功率,Cthi(Pthi)、Chyi(Phyi)、Cw(Pw)和Cpv(Ppv)分别为火电、水电、风电和光伏的发电成本;
2)碳排放量最小:
式中,αi、βi和γi为火电机组的碳排放系数,Pthi为火电机组的出力;
3)用户舒适度最高:
式中,N为微元网中用户的数量,v(i)和g(i)为惩罚函数,Tr和Tw分别为当前室温和当前水温,fr和fw分别为当前室温和水温与用户期望室温差和水温差的平方,计算公式如下:
fr(Tr(i))=(Tr(i)-Er(i))2,
fw(Tw(i))=(Tw(i)-Ew(i))2,
式中,Er和Ew分别为用户期望室温和期望水温;
等式和不等式约束由下式表示:
式中,Ploss为总有功损耗,Pload为总有功负荷,Qthi、Qhyi、Qw和Qpv分别为火电、水电、风电和光伏所发出的无功功率,Qloss为总无功损耗,Qload为总无功负荷,PG和QG分别代表各个类型发电机的有功和无功出力,PG,min和PG,max分别为有功出力的最小值和最大值,QG,min和QG,max分别为无功出力的最小值和最大值,Vj为节点j的电压,Vj,min和Vj,max分别为节点j的最小电压和最大电压,Si为线路传输功率,Si,max为线路最大传输功率,Tr,max和Tw,max分别为最高室温和最高水温;
帕累托多目标优化方法用如下数学式来表示优化过程:
MinFi(X),i=1,2,...,Mobj,
式中,Fi为第i个目标函数;X为决策向量;Mobj为目标函数的个数,Mobj=3;
约束条件:
式中,Mineq为不等式约束的个数,Meq为等式约束的个数,Mdv为决策向量的个数,gi(X)为不等式约束的表达式,hi(X)为等式约束的表达式,Li和Ui分别为第i个决策向量Xi的最小值和最大值;帕累托多目标优化最终是得到一组优化解;如果解向量Xa优于解向量Xb,则解向量Xb即被解向量Xa覆盖或支配,如下式;
在整个搜索空间中都不能被覆盖或被支配的解即为帕累托最优解,将这些解映射到目标空间的适应度向量为帕累托前沿,表示为:
PF={F=(F1(X),F2(X),...,FMobj(X))|X∈X*},
式中,PF为帕累托前沿,X*为一组帕累托最优解;
纳什博弈帕累托多目标优化方法的每个循环周期内部落都经历部落划分、部落繁衍和部落迁徙三个阶段;不断地逼近最佳“栖息地”,即逼近帕累托前沿;首先,根据一个随机选择的目标函数值对全部个体按降序进行排列;然后,在每一个循环周期中,均匀地选择Ntr个初始成员,以每个初始成员为基础形成部落,并且计算出每个个体和初始成员的欧式距离;最后,根据个体间的距离来将剩下的成员分配到各个部落,每个个体和初始成员的欧式距离的计算式如下:
式中,dij为个体i与个体j之间的欧式距离,fik与fjk分别为第i个个体与第j个个体的第k个目标值,fkmax与fkmin分别为第k个目标的最大值与最小值,N0为个体数,Ntr为部落数,Dim为目标函数个数;
若现有的生存空间减小,一些个体就会迁徙到其它适合生存的空间来:
xik=rand
式中,xik为第k个目标函数中的第i个个体的位置,rand代表取随机数,其范围为[xkmin,xkmax],xkmax和xkmin分别为第k个目标函数中每个个体位置的最大值和最小值;
非支配个体的数量将随着循环而增加,通过迭代逐步降低迁移概率来动态调整迁移者的数量:
式中,pmig为迁徙概率,pmax和pmin分别为最大和最小迁徙概率,It为当前迭代次数,Itmax为最大迭代次数,sinh()为双曲正弦函数,Cmig和kmig分别为确定双曲正弦函数的变化斜率;
纳什博弈平衡由下式表示:
式中,hij是对应的第i个目标函数的第j个帕累托优化解(PF中的第j个元素),vi表示为第i个目标函数的拟合值期望的上限,Mpf是预先指定的大小,表示有限的PF集,ωi是对于第i个目标函数的相对重要性的权重,fij是对应于第i个目标函数的第j个帕累托优化解的规范适应值;
约束条件:
(2)利用生成式对抗网络,生成海量虚拟场景,构成深度置信网络的样本数据产生系统;
(3)将所有样本数据输入已完成预学习的深度置信网络中,即通过已完成网络参数θ学习的深度置信网络得到初步最优解Xpr;
深度置信网络,具有多层神经网络结构,特征提取能力强,通过预学习获取输入的训练样本数据与输出的初步最优值之间的关系;一旦完成预学习,深度置信网络能够快速从海量样本中获取初步最优值;深度置信网络是一个多层的概率生成模型,由多个受限波尔兹曼机和一个回归层栈式叠加而成,输入层由可见变量v构成,输出层由隐藏变量h构成;
可见单元由向量v=[v1,v2,v3,...,vn]T表示,隐藏单元由向量h=[h1,h2,h3,...,hm]T表示,内部参数表示为θ,T表示转置,基于能量模型联合概率分布为:
式中,Z(θ)为归一化因子,exp()为指数函数,E(v,h;θ)为能量函数,表示为:
式中,ai为可见单元i的偏置,bj为隐藏单元j的偏置,wij为可见单元i与隐藏单元j的神经元连接权重;
当可见变量v给定时,隐藏变量h表示为:
式中,为sigmoid激活函数;
当隐藏变量h给定时,可见变量v表示为:
受限玻尔兹曼机训练的目的是使可见层v的联合概率密度最大,对于一个训练样本集S={v1,v2,...,vs},v1、v2、…、vs分别为第1个到第s个样本数据,需要调整参数θ使得对数似然函数L(θ)最大,由极大似然估计原理得:
式中,表示求当对数似然函数L(θ)取最大值时θ的值,s为训练样本数据的个数,vk为第k个样本数据;
多层受限波尔兹曼机通过贪婪学习的逐层预训练方式提取输入数据的隐含特征;完成前向预训练后,需要进行反向调整;回归层起到反向微调的作用,把提取的数据隐含特征映射到输出值上;上述两个阶段完成后,即完成深度置信网络的参数θ的学习;
(4)在初步最优解Xpr附近选取样本数据,再次利用纳什博弈帕累托多目标优化方法,实现微元网的快速调度优化决策。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011189644.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改进的钢带辊上料装置
 - 下一篇:一种基于教育的名人事展示设备
 
- 同类专利
 
- 专利分类
 
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





