[发明专利]一种基于车路云协同的联合计算迁移和资源分配方法有效
申请号: | 202110659780.0 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113543074B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 王书墨;柴新越;彭昱捷;王合伟;宋晓勤;程梦倩;陈权 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | H04W4/44 | 分类号: | H04W4/44;G06N3/084;G06F9/50;H04W72/53;H04W16/22 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 马苗苗 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 车路云 协同 联合 计算 迁移 资源 分配 方法 | ||
1.一种基于车路云协同的联合计算迁移和资源分配方法,其特征在于,包括步骤如下:
步骤(1)构建基于车-路-云协同的车载网络模型,车辆可以接入云或者移动边缘设备;
步骤(2)建立包括N个用户迁移J个任务的联合计算迁移和资源分配模型;
步骤(3)每辆车迁移任务时获取周边移动边缘设备的资源集合μm,数据中心云服务器的资源集合σc以及任务信息wn,j;
步骤(4)采用分布式的资源分配方法,在考虑每条计算迁移链路服务质量要求的情况下,以合理高效的计算迁移和资源分配达到系统时延最小化为目标构建深度强化学习模型,其中,状态空间S为与计算迁移和资源分配有关的信息,动作空间A为无线接入方式,发射功率和选择的信道,奖励函数R为系统时延取负值,具体为:
步骤(4.1)、具体地定义状态空间S为与计算迁移和资源分配有关的信息,包括每个MEC的资源集合μm,数据中心云服务器的资源集合σc,需要执行任务的相关信息wn,j,即:
st={μm,σc,wn,j}
μm={Qm,Rm,fm,Em},其中Qm表示MEC服务器的最大计算资源,Rm表示MEC服务器最大可用存储容量,fm表示MEC服务器的计算能力,Em表示MEC服务器CPU每运转一周消耗的能量;
σc={fc,Ec},fc表示中心云服务器的计算能力,Ec表示中心云服务器CPU每运转一周消耗的能量,在这里中心云服务器拥有足够的存储资源及计算资源保证任务可以被正常执行;
wn,j={dn,j,tn,j,cn,j,qn,j,n∈N,j∈J},dn,j表示用户n要迁移的任务j的大小,tn,j表示用户n对任务j的最大可容忍时延,cn,j表示用户n完成任务j所需的CPU周期数,qn,j表示用户n要计算任务j所需的计算资源;
将每辆车视为智能体,每次车基于当前状态st∈S选择无线接入方式,子信道和发射功率;
步骤(4.2)、定义动作空间A为无线接入方式,发射功率和选择的信道,表示为:
无线接入方式λ:每辆车有M+1种任务迁移决策,令λn={0,1,2,...,M},λn={1,2,...,M}表示车辆n选择将其计算任务迁移到路边单元m上的边缘服务器执行,而λn=0是车辆n决定将其计算任务迁移到数据中心云服务器上执行;
子信道C:选择MEC进行任务迁移,在路边单元的可用带宽下有I个子信道可以选择,选择数据中心云服务器进行任务迁移,在宏蜂窝的可用带宽下有K个子信道可以选择
传输功率P:车辆n在上传j任务时选择不同的发射功率,但受到其设置的最大发射功率的限制;
步骤(4.3)、定义奖励函数R,联合计算迁移和资源分配的目标是车选择无线接入方式、子信道和发射功率,在满足每条计算迁移链路服务质量要求的情况下,以合理高效的计算迁移和资源分配达到系统时延最小化为目标,因此奖励函数可以表示为:
其中,为第n个用户将第j个任务上传到第m个边缘服务器的上传时延,为第m个边缘服务器处理第j个任务的计算时延,为第n个用户将第j个任务通过k信道上传到数据中心云服务器的上传时延,为第j个任务通过k信道上传到数据中心云服务器的计算时延,且表示n用户执行其产生的第j个计算任务时只能选择一种接入方式,选择接入到移动边缘设备或者云设备,表示n用户执行其产生的第j个计算任务时选择接入到移动边缘设备,表示n用户执行其产生的第j个计算任务时选择接入到云设备;
为了获得长期的良好回报,应同时考虑眼前的回报和未来的回报,因此,强化学习的主要目标是找到一种策略来最大化预期的累积折扣回报,
其中β∈[0,1]是第一折扣因子;
步骤(4.4)、依据建立好的S,A和R,在Q学习的基础上建立深度强化学习模型,评估函数Q(st,at)表示从状态st执行动作at后产生的折扣奖励,Q值更新函数为:
其中rt为即时奖励函数,γ为第二折扣因子,st为车在t时刻的获取的移动边缘服务器、云服务器和现有任务状态信息,st+1表示车在执行at后的状态,A为动作at构成的动作空间;
步骤(5)考虑连续动作空间中的联合优化问题,利用包含深度学习拟合,软更新,回放机制三个方面的DDPG算法优化深度强化学习模型;
步骤(6)根据优化后的深度强化学习模型,得到最优用户无线接入方式,发射功率和信道分配策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110659780.0/1.html,转载请声明来源钻瓜专利网。