[发明专利]一种基于深度强化学习的Femtocell异构网络功率自适应优化方法在审
| 申请号: | 202111079364.X | 申请日: | 2021-09-15 |
| 公开(公告)号: | CN113795049A | 公开(公告)日: | 2021-12-14 |
| 发明(设计)人: | 郭伟;汪玉冰;郭晓明;张丰丰;徐煜 | 申请(专利权)人: | 马鞍山学院 |
| 主分类号: | H04W52/04 | 分类号: | H04W52/04;G06F30/18;G06F30/27;G06N3/04;G06N3/08;G06N7/00;G06F111/02;G06F111/04;G06F111/08;G06F119/06 |
| 代理公司: | 安徽知问律师事务所 34134 | 代理人: | 郭大美 |
| 地址: | 243100 安徽*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 强化 学习 femtocell 网络 功率 自适应 优化 方法 | ||
1.一种基于深度强化学习的Femtocell异构网络功率自适应优化方法,其特征在于:包括如下步骤:
步骤S1、建立Femtocell异构网络系统模型,并进行问题建模
设计Femtocell异构网络中基站类型、数量、服务的用户数量、干扰的类型以及系统实现的目标,并就以上系统元素以及系统目标建立数学优化模型;
步骤S2、将基于Femtocell异构网络的功率自适应优化问题建模成马尔科夫决策过程MDP,设计其状态空间、动作空间以及奖励函数
设计其MDP元组元素,具体为一个基本的MDP模型通常是由S,a,P,R,γ五元组构成,其中S表示环境中的状态集合,a表示环境中可采取的动作集合,P是状态转移概率矩阵P(s′|s,a)表示在智能体状态s时执行动作a后转移到状态s′的概率,其中P(s′|s,a)=P(st+1=s′|st=s,at=a)∈[0,1],R是回报函数,Ra(s→s′)表示智能体在状态s时执行动作a后转移到状态s′时环境反馈回的回报值,γ为折扣系数,0≤γ≤1;
步骤S3、深度强化学习算法DDPG搭建
设计DDPG算法中的Actor网络和Critic网络,其中Actor和Critic网络均具有当前策略网络和目标策略网络;
其中Actor当前策略网络μ负责策略网络参数θ的迭代更新,根据当前智能体感知的状态S选择当前动作A;
其中Actor目标网络μ′负责根据经验回放池中采用的下一状态S′选择动作A′,网络参数θ′定期从θ复制;
其中Critic当前策略网络Q负责网络参数ω的迭代更新,负责计算当前状态S、动作A的Q值Q(S,A,ω);
其中Critic目标网络Q′负责计算下一状态S′、下一动作A′的Q′值Q′(S′,A′,ω′),网络参数ω′定期从ω复制;
步骤S4、模型训练
通过利用Actor当前策略网络μ感知当前状态并产生执行动作,获得环境反馈的奖励以及下一状态,将上述信息存入经验回放池;
Actor当前策略网络参数μ的训练使用损失梯度
Critic当前策略网络参数ω的训练使用均方损失函数进行反向传播更新参数,其中yj=Rj+γQ′(S′,A′,ω′)。
2.根据权利要求1所述的基于深度强化学习的Femtocell异构网络功率自适应优化方法,其特征在于:问题建模的问题模型描述如下:
s.t.Pmin≤Pi≤Pmax,i=1,...,N (1)
CMUE≥lMUE (2)
其中为Femtocell基站群选择的发射功率集合,式(1)表示FBS发射功率约束,式(2)、式(3)分别表示MUE、FUE信息约束。
3.根据权利要求2所述的基于深度强化学习的Femtocell异构网络功率自适应优化方法,其特征在于:
在步骤S2中,基于步骤S1中建立的系统模型,建立MDP过程,智能体为每一个Femtocell基站,即FBSi,i∈{1,...,N};动作集合设计为智能体FBS允许分配的发射功率,DDPG算法可在连续合法功率取值空间中进行功率决策,即每一个FBS都将从动作集合Pmin≤a∈A≤Pmax中选择一个发射功率;状态集合定义主要考虑到距离因素和阈值约束因素,对于第i个智能体FBS,在时刻t定义其状态s∈S为其中表示MUE在时刻t的信息容量是否超过了指定阈值lMUE,即状态表示FUE在时刻t信息容量是否超过设定阈值即表示在时刻t第i个FBS与MUE之间距离可取0、1、2、3四个值,当取0时说明第i个FBS与MUE距离很近,同理取3时说明距两者相距较远,即类似的,表示在时刻t第i个FBS与MBS之间距离可取0、1、2、3四个值,即定励函数的设计主要考虑到网络容量和约束关系,每一个智能体FBS选择、执行完动作级发射功率后获得的奖励
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马鞍山学院,未经马鞍山学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111079364.X/1.html,转载请声明来源钻瓜专利网。





