[发明专利]一种车辆编队模式下基于NOMA的分布式资源分配方法有效

专利信息
申请号: 201911214993.1 申请日: 2019-12-02
公开(公告)号: CN111132083B 公开(公告)日: 2021-10-22
发明(设计)人: 郭彩丽;许世琳;冯春燕;王兆丰 申请(专利权)人: 北京邮电大学
主分类号: H04W4/44 分类号: H04W4/44;H04W4/46;H04W52/24;H04W52/26;H04W52/38;H04W72/04;H04W72/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 车辆 编队 模式 基于 noma 分布式 资源 分配 方法
【权利要求书】:

1.一种车辆编队模式下基于NOMA的分布式资源分配方法,其特征在于,该资源分配方法包括:

步骤1:考虑系统模型中无线信道大尺度衰落和小尺度衰落的影响,建立信道模型;

步骤2:在保护V2I链路正常通信的情况下最大化车与多车(vehicle to multi-vehicle,V2mV)链路的传输速率,将优化目标设置为最大化V2mV链路总的吞吐量;

首先表征V2mV内部干扰、其他V2mV链路与V2mV n复用相同信道l导致的相互干扰、以及由基站引起的干扰和

其中,Ψn为车辆编队n包含的车辆集合,μv和μw分别为接收车辆v和w的功率分配因子,Pn和Pm分别为V2mV n和m中发射车辆的发射功率,Plc为在频段l处基站的发射功率,为车辆编队n中发送车辆与第v辆接收车辆通信的信道增益,为车辆编队m中的发送车辆对编队n中第v辆接收车辆的干扰,为基站对车辆编队n中第v辆接收车辆的干扰,Ωl={1,2,…,L}表示可用频谱资源集,L为可以分配的频谱资源块的数量,l∈Ωl为已分配到V2mVn上的频段;

其次,分别表征用户v和用户w在编队n中的吞吐量和

其中,Bl为在频段l处的基站发射带宽,N0为加性高斯白噪声的功率谱密度,μv和μw分别为用户v和w的功率分配因子,为车辆编队n中发送车辆与第w辆接收车辆通信的信道增益;

最后,表征优化目标为最大化V2mV链路总的吞吐量:

其中,P={Pn,Pm,Plc},N为自动驾驶的车辆编队的总数;

步骤3:考虑V2I和V2mV链路的频率复用对V2I链路正常通信的影响,表征考虑干扰的V2I链路传输速率,并对其进行约束表征;

表征V2I链路k的吞吐量为:

其中,为V2I链路k受到的干扰,为V2mV n对第k辆单独行驶车辆的干扰,为基站到第k辆单独行驶车辆通信的信道增益;

基于频谱复用的车辆编队模型为保证V2I链路的通信质量,应以p0的概率大于既定的阈值

其中,K为单独行驶的车辆的总量;

步骤4:以最大化V2mV链路总的吞吐量为优化目标,将V2I链路的传输速率阈值、功率分配约束和子信道分配约束作为优化问题的约束条件,构建车辆编队下基于NOMA的分布式资源分配模型,并将优化问题解耦为功率分配和子信道分配两个部分:

其中,第一个约束条件表示V2I链路k的吞吐量应以p0的概率大于既定的阈值第二个约束条件中Sn,l=1表示频段l已分配给V2mV n,Sn,l=0则表示频段l未分配给V2mV n;第三和第四个约束条件给出了子信道l的最大复用数,其中Lmax定义为频段的最大复用数;第五和第六个约束条件中为V2mV n中第v辆车的接收功率,和分别限制了V2mVn和基站的最大功率;

步骤5:采用基于车道条件的功率分配方案,根据不同车道对应的安全距离对功率分配进行合理地调整,从而减小不同车道上NOMA之间吞吐量的差异性:

首先分析得到第n个V2mV编队吞吐量Rn的计算方法,推导编队内部信干噪比的不等关系,得到Rn的近似式;其次,为减小不同车道上NOMA之间的差异性,计算不同车道上的编队n和m吞吐量的差值函数Rn-Rm,该差值是关于车辆编队发送功率Pn和Pm的函数:

其中,Ψn和Ψm为车辆编队n和m包含的车辆集合,为第n个车辆编队中的发送车辆与第|Ψn|辆车通信的信道增益,为第m个车辆编队中的发送车辆与第|Ψm|辆车通信的信道增益;

最后,为减小吞吐量的差异性,引入支持NOMA的V2mV链路的基准功率,将基准功率分配给安全距离最小的车道,并令完成其他车道上基于NOMA的车辆编队功率分配,其中dn和dm分别为车辆编队n和m内车辆间的安全间距,γ为路径损耗指数;

步骤6:利用分布式多智能体Q-learning算法表征子信道分配,并通过考虑基于编队位置的邻域迭代顺序来加快收敛速度:

首先构造Q-learning框架,定义框架中的智能体、动作、状态、奖励和迭代顺序;其中智能体为V2mV编队,动作为智能体以均匀分布的方式选择的子信道,状态由智能体的相对速度、位置、功率分配和子信道状态组成,奖励为智能体的吞吐量,迭代顺序决定V2mV链路进行Q-learning的顺序;

其次,获得智能体基于迭代顺序的最优子信道分配解,使用Q表存储由不同状态和动作得到的奖励值,并根据Bellman最优方程得到最优的Q值,并根据动作选择策略πa更新Q表,策略πa为:

其中,策略πa的价值分别对应于选择动作a的概率和探索概率ε,A是智能体可选择的动作集合,|A|是智能体所选择的动作总数,为智能体在状态s、动作a时的Q值;

最后,得到收敛后的Q表,并根据已收敛的Q表选择最优的动作和状态,确定最优的子信道分配方案。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911214993.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top