[发明专利]一种车辆编队模式下基于NOMA的分布式资源分配方法有效
| 申请号: | 201911214993.1 | 申请日: | 2019-12-02 |
| 公开(公告)号: | CN111132083B | 公开(公告)日: | 2021-10-22 |
| 发明(设计)人: | 郭彩丽;许世琳;冯春燕;王兆丰 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | H04W4/44 | 分类号: | H04W4/44;H04W4/46;H04W52/24;H04W52/26;H04W52/38;H04W72/04;H04W72/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 车辆 编队 模式 基于 noma 分布式 资源 分配 方法 | ||
1.一种车辆编队模式下基于NOMA的分布式资源分配方法,其特征在于,该资源分配方法包括:
步骤1:考虑系统模型中无线信道大尺度衰落和小尺度衰落的影响,建立信道模型;
步骤2:在保护V2I链路正常通信的情况下最大化车与多车(vehicle to multi-vehicle,V2mV)链路的传输速率,将优化目标设置为最大化V2mV链路总的吞吐量;
首先表征V2mV内部干扰、其他V2mV链路与V2mV n复用相同信道l导致的相互干扰、以及由基站引起的干扰和
其中,Ψn为车辆编队n包含的车辆集合,μv和μw分别为接收车辆v和w的功率分配因子,Pn和Pm分别为V2mV n和m中发射车辆的发射功率,Plc为在频段l处基站的发射功率,为车辆编队n中发送车辆与第v辆接收车辆通信的信道增益,为车辆编队m中的发送车辆对编队n中第v辆接收车辆的干扰,为基站对车辆编队n中第v辆接收车辆的干扰,Ωl={1,2,…,L}表示可用频谱资源集,L为可以分配的频谱资源块的数量,l∈Ωl为已分配到V2mVn上的频段;
其次,分别表征用户v和用户w在编队n中的吞吐量和
其中,Bl为在频段l处的基站发射带宽,N0为加性高斯白噪声的功率谱密度,μv和μw分别为用户v和w的功率分配因子,为车辆编队n中发送车辆与第w辆接收车辆通信的信道增益;
最后,表征优化目标为最大化V2mV链路总的吞吐量:
其中,P={Pn,Pm,Plc},N为自动驾驶的车辆编队的总数;
步骤3:考虑V2I和V2mV链路的频率复用对V2I链路正常通信的影响,表征考虑干扰的V2I链路传输速率,并对其进行约束表征;
表征V2I链路k的吞吐量为:
其中,为V2I链路k受到的干扰,为V2mV n对第k辆单独行驶车辆的干扰,为基站到第k辆单独行驶车辆通信的信道增益;
基于频谱复用的车辆编队模型为保证V2I链路的通信质量,应以p0的概率大于既定的阈值
其中,K为单独行驶的车辆的总量;
步骤4:以最大化V2mV链路总的吞吐量为优化目标,将V2I链路的传输速率阈值、功率分配约束和子信道分配约束作为优化问题的约束条件,构建车辆编队下基于NOMA的分布式资源分配模型,并将优化问题解耦为功率分配和子信道分配两个部分:
其中,第一个约束条件表示V2I链路k的吞吐量应以p0的概率大于既定的阈值第二个约束条件中Sn,l=1表示频段l已分配给V2mV n,Sn,l=0则表示频段l未分配给V2mV n;第三和第四个约束条件给出了子信道l的最大复用数,其中Lmax定义为频段的最大复用数;第五和第六个约束条件中为V2mV n中第v辆车的接收功率,和分别限制了V2mVn和基站的最大功率;
步骤5:采用基于车道条件的功率分配方案,根据不同车道对应的安全距离对功率分配进行合理地调整,从而减小不同车道上NOMA之间吞吐量的差异性:
首先分析得到第n个V2mV编队吞吐量Rn的计算方法,推导编队内部信干噪比的不等关系,得到Rn的近似式;其次,为减小不同车道上NOMA之间的差异性,计算不同车道上的编队n和m吞吐量的差值函数Rn-Rm,该差值是关于车辆编队发送功率Pn和Pm的函数:
其中,Ψn和Ψm为车辆编队n和m包含的车辆集合,为第n个车辆编队中的发送车辆与第|Ψn|辆车通信的信道增益,为第m个车辆编队中的发送车辆与第|Ψm|辆车通信的信道增益;
最后,为减小吞吐量的差异性,引入支持NOMA的V2mV链路的基准功率,将基准功率分配给安全距离最小的车道,并令完成其他车道上基于NOMA的车辆编队功率分配,其中dn和dm分别为车辆编队n和m内车辆间的安全间距,γ为路径损耗指数;
步骤6:利用分布式多智能体Q-learning算法表征子信道分配,并通过考虑基于编队位置的邻域迭代顺序来加快收敛速度:
首先构造Q-learning框架,定义框架中的智能体、动作、状态、奖励和迭代顺序;其中智能体为V2mV编队,动作为智能体以均匀分布的方式选择的子信道,状态由智能体的相对速度、位置、功率分配和子信道状态组成,奖励为智能体的吞吐量,迭代顺序决定V2mV链路进行Q-learning的顺序;
其次,获得智能体基于迭代顺序的最优子信道分配解,使用Q表存储由不同状态和动作得到的奖励值,并根据Bellman最优方程得到最优的Q值,并根据动作选择策略πa更新Q表,策略πa为:
其中,策略πa的价值分别对应于选择动作a的概率和探索概率ε,A是智能体可选择的动作集合,|A|是智能体所选择的动作总数,为智能体在状态s、动作a时的Q值;
最后,得到收敛后的Q表,并根据已收敛的Q表选择最优的动作和状态,确定最优的子信道分配方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911214993.1/1.html,转载请声明来源钻瓜专利网。





