[发明专利]基于无人机辅助节点的边缘网络计算资源动态优化方法在审
申请号: | 202210079544.6 | 申请日: | 2022-01-24 |
公开(公告)号: | CN114513814A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 鲍宁海;高鹏雷;陈奎 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | H04W28/08 | 分类号: | H04W28/08;H04W28/02;H04W4/40;H04W24/02;H04W24/06 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 无人机 辅助 节点 边缘 网络 计算 资源 动态 优化 方法 | ||
1.一种基于无人机辅助节点的边缘网络计算资源动态优化方法,其特征在于,包括以下步骤:
101、根据马尔科夫决策过程构造离散时间-状态模型,包括将无人机巡航时间离散为时隙,设立时隙变量k、地空网络状态向量sk、无人机三维动作向量ak、无人机动作奖励函数rk,其中,sk,ak,rk随时隙数k的增加作相应的转移和变化,初始化时隙变量k=0;
102、将无人机控制器作为智能体,基于双延时深度确定性策略梯度算法思想构建深度强化学习模型,包括建立系统环境采集器、无人机动作策略网络π、无人机状态-动作值网络Q,任务调度策略发生器、无人机动作奖励发生器、经验样本存储区E,随机样本集Mini-Batch;
103、令k=k+1,如果无人机在连续n个时隙内未发生三维坐标位置变化,跳转到步骤106,否则,根据无人机j的有效覆盖范围确定无人机j的用户对象集Ij,基站o的用户对象集Io=I-Ij,其中,I表示全体用户对象集,通过任务调度策略发生器,获得Ij与Io的任务卸载决策变量集和跳转到步骤104;
104、根据和执行用户i的任务卸载请求,通过无人机动作奖励发生器获得相应的奖励值rk,通过无人机动作策略网络π获得k时隙无人机三维动作向量ak,由k时隙地空网络状态向量sk与动作向量ak计算获得sk+1,将[sk,ak,rk,sk+1]存入经验样本存储区E;
105、从经验样本存储区E中随机抽样获得Mini-Batch样本集,并将Mini-Batch样本集分别导入动作策略网络π与状态-动作值网络Q进行训练,跳转到步骤103;
106、算法结束。
2.根据权利要求1所述的一种基于无人机辅助节点的边缘网络计算资源动态优化方法,其特征在于,所述步骤101中根据马尔科夫决策过程构造离散时间-状态模型,其中,k时隙的地空网络状态向量sk、无人机三维动作向量ak、无人机动作奖励函数rk,分别如公式(1)、(2)、(3)所示:
公式(1)中,表示无人机j在k时隙的三维坐标位置,表示用户i在k时隙的二维坐标位置;公式(2)中,表示无人机j在k时隙的水平运动方向,表示无人机j在k时隙的垂直运动距离;公式(3)中,ω表示无人机动作奖励函数权重因子,ω∈(0,1),Δt表示时隙大小,表示k时隙用户i的平均单位任务时延,如公式(4)所示,表示k时隙用户i的平均单位任务时延满足平均单位任务容忍时延τi,否则为如公式(5)所示:
公式(4)中,表示用户i与无人机j的连接状态,若用户i在k时隙将任务卸载到无人机j执行,则否则表示用户i与基站o的连接状态,若用户i在k时隙将任务卸载到基站o执行,则否则用户i在k时隙最多只能与一架无人机或基站相连接,即表示用户i在k时隙卸载到无人机j的任务量,表示用户i在k时隙卸载到基站o的任务量,τi表示用户i平均单位任务容忍时延。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210079544.6/1.html,转载请声明来源钻瓜专利网。