[发明专利]一种非圆信号辅助NOMA系统的功率分配方法有效
申请号: | 202110473323.2 | 申请日: | 2021-04-29 |
公开(公告)号: | CN113194542B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 黄永明;程浩;郑冲;夏亦犁 | 申请(专利权)人: | 东南大学 |
主分类号: | H04W72/04 | 分类号: | H04W72/04;H04W72/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 吴旭 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信号 辅助 noma 系统 功率 分配 方法 | ||
1.一种非圆信号辅助NOMA系统的功率分配方法,其特征在于,包括如下步骤:
(1)将非圆信号应用于非正交多址接入系统,写出各用户的接收信号表达式,推导出基于非圆信号的系统各用户的传输速率表达式;
(2)构建以最大化系统吞吐量为优化目标,以用户最小速率受限为约束条件的优化问题模型;
(3)使用强化学习Q learning的方法求解步骤(2)所述优化问题模型;
3.1)将非圆系数和用户功率平均分成若干个等级,即均匀分布的离散值,将离散的非圆系数和用户功率组合作为系统的动作向量;
3.2)将系统的奖励设定为当前动作执行后的系统速率,如若不满足用户的最小功率限制则奖励为负值;
3.3)最后,通过强化学习Q learning的方法迭代得出用户最小速率约束下的非圆系数和功率分配方案设计;
步骤(1)所述各用户的接收信号表达式推导过程为:
所述非正交多址接入系统为一个两用户的下行非正交多址接入系统,其中靠近基站的近距离用户1分配较小的功率p1,远离基站的远距离用户2分配较大的功率p2,即p1≤p2;
假设用户1的最大功率是P1,用户2的功率固定为P2,并且满足P1≤P2;设定从基站到用户i的信道为其中i=1,2,gi表示瑞利衰落信道,di是基站到用户i的距离,τ是路径损耗指数;
在所述非正交多址接入系统中,用户2直接将自己的信号解出,而用户1采用干扰消除的方法先将用户2的信号解出,然后消除掉用户2的信号再解调出用户1自己的信号,其中,由用户2带来的冗余干扰为用户2接收信号的λ倍, 0<λ<1;因此,用户i接收到的信号分别为:
其中wi是均值为零方差为的加性白高斯噪声,hi为从基站到用户i的信道,x1是用户1发送的传统圆信号,x2是用户2发送的待设计的非圆信号,zi是用户i的干扰信号;
步骤(1)所述基于非圆信号的系统各用户的传输速率表达式为:
其中,和分别为用户i的接收信号与干扰信号的标准方差;和表示用户i的接收信号与干扰信号的伪方差;为用户i的噪声功率;为用户i的信道噪声比,κ为非圆系数;并且满足Γ1≥Γ2;Ri均由两个部分组成,即传统圆信号部分Ri,Proper和非圆部分Ri,Improper;
步骤(2)所述优化问题模型表示为:
其中是用户i的最小速率;
所述步骤3.1)具体为:
将非圆系数κ和用户1的功率p1分别分成N1,N2个等级,那么第l个等级的非圆系数表示为用户1第k个等级的功率表示为强化学习中的状态空间,动作空间分别设置如下:
状态空间:假设学习过程中在时间t的状态为st∈{0,1},状态的选择依据是所选择的动作是不是满足系统对各用户最小速率的要求,即
动作空间:将不同功率和非圆系数的组合作为系统的动作向量,表示为
其中au=[p1,k,κl]T为系统的第u个动作向量,所有动作组合个数为N1N2;
根据当前的Q值,使用ε贪婪算法来选择下个时间的动作向量,具体步骤包含:
①选择ε∈(0,1);
②以1-ε的概率选择当前最大Q值对应的动作向量,即功率和非圆系数组合:
步骤3.2)所述奖励所使用的奖励函数表示为:
其中Ri中的非圆系数κ和用户1的功率p1是当前的执行动作;
所述步骤3.3)中Q learning的更新过程为:
其中,αt和γ分别为Q learning中的学习率和折扣因子,rt+1为系统在下个时刻的奖励;
得到用户1的最优功率和系统的非圆系数为:
其中a代表系统的任意一个动作向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110473323.2/1.html,转载请声明来源钻瓜专利网。