首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种非圆信号辅助NOMA系统的功率分配方法有效

申请号：	202110473323.2	申请日：	2021-04-29
公开（公告）号：	CN113194542B	公开（公告）日：	2022-10-14
发明（设计）人：	黄永明;程浩;郑冲;夏亦犁	申请（专利权）人：	东南大学
主分类号：	H04W72/04	分类号：	H04W72/04;H04W72/08
代理公司：	南京瑞弘专利商标事务所(普通合伙) 32249	代理人：	吴旭
地址：	211189 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种信号辅助 noma 系统功率分配方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种非圆信号辅助NOMA系统的功率分配方法，其特征在于，包括如下步骤：

(1)将非圆信号应用于非正交多址接入系统，写出各用户的接收信号表达式，推导出基于非圆信号的系统各用户的传输速率表达式；

(2)构建以最大化系统吞吐量为优化目标，以用户最小速率受限为约束条件的优化问题模型；

(3)使用强化学习Q learning的方法求解步骤(2)所述优化问题模型；

3.1)将非圆系数和用户功率平均分成若干个等级，即均匀分布的离散值，将离散的非圆系数和用户功率组合作为系统的动作向量；

3.2)将系统的奖励设定为当前动作执行后的系统速率，如若不满足用户的最小功率限制则奖励为负值；

3.3)最后，通过强化学习Q learning的方法迭代得出用户最小速率约束下的非圆系数和功率分配方案设计；

步骤(1)所述各用户的接收信号表达式推导过程为：

所述非正交多址接入系统为一个两用户的下行非正交多址接入系统，其中靠近基站的近距离用户1分配较小的功率p₁，远离基站的远距离用户2分配较大的功率p₂，即p₁≤p₂；

假设用户1的最大功率是P₁，用户2的功率固定为P₂，并且满足P₁≤P₂；设定从基站到用户i的信道为其中i＝1,2，g_i表示瑞利衰落信道，d_i是基站到用户i的距离，τ是路径损耗指数；

在所述非正交多址接入系统中，用户2直接将自己的信号解出，而用户1采用干扰消除的方法先将用户2的信号解出，然后消除掉用户2的信号再解调出用户1自己的信号，其中，由用户2带来的冗余干扰为用户2接收信号的λ倍， 0＜λ＜1；因此，用户i接收到的信号分别为：

其中w_i是均值为零方差为的加性白高斯噪声，h_i为从基站到用户i的信道，x₁是用户1发送的传统圆信号，x₂是用户2发送的待设计的非圆信号，z_i是用户i的干扰信号；

步骤(1)所述基于非圆信号的系统各用户的传输速率表达式为：

其中，和分别为用户i的接收信号与干扰信号的标准方差；和表示用户i的接收信号与干扰信号的伪方差；为用户i的噪声功率；为用户i的信道噪声比，κ为非圆系数；并且满足Γ₁≥Γ₂；R_i均由两个部分组成，即传统圆信号部分R_i,Proper和非圆部分R_i,Improper；

步骤(2)所述优化问题模型表示为：

其中是用户i的最小速率；

所述步骤3.1)具体为：

将非圆系数κ和用户1的功率p₁分别分成N₁,N₂个等级，那么第l个等级的非圆系数表示为用户1第k个等级的功率表示为强化学习中的状态空间，动作空间分别设置如下：

状态空间：假设学习过程中在时间t的状态为s_t∈{0,1}，状态的选择依据是所选择的动作是不是满足系统对各用户最小速率的要求，即

动作空间：将不同功率和非圆系数的组合作为系统的动作向量，表示为

其中a_u＝[p_1,k,κ_l]^T为系统的第u个动作向量，所有动作组合个数为N₁N₂；

根据当前的Q值，使用ε贪婪算法来选择下个时间的动作向量，具体步骤包含：

①选择ε∈(0,1)；

②以1-ε的概率选择当前最大Q值对应的动作向量，即功率和非圆系数组合：

步骤3.2)所述奖励所使用的奖励函数表示为：

其中R_i中的非圆系数κ和用户1的功率p₁是当前的执行动作；

所述步骤3.3)中Q learning的更新过程为：

其中，α_t和γ分别为Q learning中的学习率和折扣因子，r_t+1为系统在下个时刻的奖励；

得到用户1的最优功率和系统的非圆系数为：

其中a代表系统的任意一个动作向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110473323.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种高温超导多极磁体结构及其粒子医疗设备
下一篇：一种用于工作系统的障碍物检测系统

同类专利

专利分类

H04 电通信技术
H04W 无线通信网络
H04W72-00 本地资源管理，例如，无线资源的选择或分配或无线业务量调度
H04W72-02 .通过用户或终端选择无线资源
H04W72-04 .无线资源分配
H04W72-12 .无线业务量调度
H04W72-14 ..使用授权的信道
H04W72-06 ..基于无线资源的等级标准

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top