[发明专利]一种基于图深度学习的图组合优化问题求解方法在审
申请号: | 202110553836.4 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113205181A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 杜海舟;严宗 | 申请(专利权)人: | 上海电力大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 王晓东 |
地址: | 200090 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 组合 优化 问题 求解 方法 | ||
1.一种基于图深度学习的图组合优化问题求解方法,其特性在于,包括:
获取输入图信息并进行预处理,得到所述输入图的每一个顶点与权值相关的特征,通过分析关于Steiner树的贪心算法得到更新后的矩阵X;
基于编码-处理-解码的架构构建图神经网络,将更新后的矩阵X作为所述图神经网络的输入,得到表示顶点信息的隐藏向量并进行深度强化学习训练;
利用贪心算法根据强化学习训练后的图神经网络选择当前状态下价值最大的顶点,完成图组合优化问题的求解。
2.如权利要求1所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述图神经网络的编码网络包括,
整合当前顶点状态和初始权重信息生成一个P维的潜在向量表示,计算公式如下:
μv=relu(θ1[sv,tv]+θ2xv)
其中,表示模型参数,relu表示非线性单元,[,]表示连接操作,xv表示对输入图进行预处理后的初始顶点权值,sv表示顶点是否被选中的状态信息,tv表示是否是终端顶点的状态,μv表示顶点嵌入向量。
3.如权利要求1所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述图神经网络的处理网络包括,
将获取的所述顶点嵌入向量μv处过网络进行处理,所述处理网络通过来自邻居节点的消息传递策略更新一个隐藏的顶点嵌入向量μ′v,即处理网络捕捉向量之间的变化,然后将它们拼接到P维向量的后面,所述隐藏的顶点嵌入向量μ′v计算公式为:
μ′v=lθrelu[μv,∑u∈N(v)(μv-μu)]
其中,N(v)表示顶点v邻居节点的集合。
4.如权利要求1所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述图神经网络的解码网络包括,
将图上所有顶点的状态∑u∈Vμ′u和要被添加的顶点隐藏嵌入向量μ′v共同定义一个评价函数Q,然后将其参数化为Q(S,v;θ),即基于整个图的状态和当前顶点生成顶点的价值,所述Q(S,v;θ)的计算公式为:
其中,θ4,Q(S,v;θ)表示顶点潜在的权重。
5.如权利要求1~4任一项所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述深度强化学习包括,
采用标准的Q学习来更新所述图神经网络参数,每一步都采用SGD优化器去最小化均方误差,所述均方误差计算公式包括,
J(θ)=(y-Q(St,vt;θ))2
其中,y来自于目标网络。
6.如权利要求5所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述目标网络的计算公式包括,
其中,γ表示折扣率,设置在0-1之间,表示来自下一状态的衰减程度。
7.如权利要求5所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述目标网络的计算公式进一步包括,
在环境网络中找到于最大Q值相对应的顶点,计算公式如下:
v′=argmaxv′Q(St+1,v′;θ)
将该计算公式代入所述目标网络的计算公式,得到一个新的目标网络估计,计算公式如下:
8.如权利要求1所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述矩阵X包括,
通过对所述输入图预处理获得图上每一个顶点与权值相关的特征;
当每次添加一个邻接顶点vi时,计算所述顶点vi与其他终端顶点的距离,采用一个矩阵来表示最短的距离:
其中,第i行和第j列的元素xij表示顶点vi到终端顶点vj的最短距离,i∈|V|表示顶点的个数V,j∈|T|表示终端顶点的个数|T|。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电力大学,未经上海电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110553836.4/1.html,转载请声明来源钻瓜专利网。