[发明专利]一种认知无线网络中分布式多用户动态频谱接入方法有效
| 申请号: | 201810737835.3 | 申请日: | 2018-07-06 |
| 公开(公告)号: | CN108880709B | 公开(公告)日: | 2019-05-07 |
| 发明(设计)人: | 李立欣;杨佩彤;张会生;高昂;梁微;李旭 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | H04L12/24 | 分类号: | H04L12/24;H04W16/10;H04B17/309;H04B17/382 |
| 代理公司: | 陕西增瑞律师事务所 61219 | 代理人: | 刘艳霞 |
| 地址: | 710072 陕西*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 认知用户 认知无线网络 动态频谱 多用户 算法 信道 训练神经网络 频带利用率 博弈理论 动作选择 构建系统 函数逼近 计算系统 继续执行 频谱选择 神经网络 授权用户 系统模型 系统容量 高频谱 奖赏 相等 演进 传输 共享 小区 更新 | ||
1.一种认知无线网络中分布式多用户动态频谱接入方法,其特征在于,该方法如下:
步骤一、构建系统模型,所述系统模型为:小区中的n个授权用户和k个认知用户共享b个信道;其中:n、k和b取不为零的自然数,且n和b的取值相等;k>n;
步骤二、采用DQN算法对认知用户进行频谱选择和接入,具体为:
设定初始Q函数,设定每一个认知用户作为一个执行者,每一个执行者按照DQN算法进行动作选择,即从b个信道中选择一个进行传输,计算系统的平均效用值,采用演进博弈理论设定奖赏值;然后训练神经网络,用神经网络作为函数逼近器,得到更新后的Q函数;
步骤三、继续执行步骤二,直至得到的系统容量趋于定值;
系统的平均效用值为计算过程如下:
首先确定每个认知用户的传输效用值ui,1≤i≤k,具体为:采用信噪比作为效用值:且第i个认知用户独占信道p;
则:
其中:SNRi表示第i个认知用户获得的信噪比;
yp为信道p上授权用户的状态;为1时表明该信道被授权用户占用,为0时表明该信道未被授权用户占用;
Si为第i个认知用户发送的信号功率;
Np为信道p的噪声功率;
Si-为与第i个认知用户选择同一信道的其他用户发送的信号功率总和;
所述采用演进博弈理论确定奖赏值的过程如下:
采用复制动态方程设置奖赏值:
其中:ε为影响演进速度的因子;
xi表示与第i个用户选择相同信道的认知用户占总认知用户的比值;
u表示群体中选择接入信道的个体所得的期望效用,群体指的是所有k个认知用户的集合;
为群体平均期望效用;
奖赏值函数的设置如下:
其中:
r为奖赏值;
表示与第i个用户选择相同信道的认知用户占总认知用户的比值的变化率;
当变化率大于等于0时,则奖赏值为+1;变化率小于0时,则奖赏值为-1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810737835.3/1.html,转载请声明来源钻瓜专利网。





