[发明专利]一种基于深度强化学习的Femtocell异构网络功率自适应优化方法在审

专利信息
申请号: 202111079364.X 申请日: 2021-09-15
公开(公告)号: CN113795049A 公开(公告)日: 2021-12-14
发明(设计)人: 郭伟;汪玉冰;郭晓明;张丰丰;徐煜 申请(专利权)人: 马鞍山学院
主分类号: H04W52/04 分类号: H04W52/04;G06F30/18;G06F30/27;G06N3/04;G06N3/08;G06N7/00;G06F111/02;G06F111/04;G06F111/08;G06F119/06
代理公司: 安徽知问律师事务所 34134 代理人: 郭大美
地址: 243100 安徽*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 强化 学习 femtocell 网络 功率 自适应 优化 方法
【权利要求书】:

1.一种基于深度强化学习的Femtocell异构网络功率自适应优化方法,其特征在于:包括如下步骤:

步骤S1、建立Femtocell异构网络系统模型,并进行问题建模

设计Femtocell异构网络中基站类型、数量、服务的用户数量、干扰的类型以及系统实现的目标,并就以上系统元素以及系统目标建立数学优化模型;

步骤S2、将基于Femtocell异构网络的功率自适应优化问题建模成马尔科夫决策过程MDP,设计其状态空间、动作空间以及奖励函数

设计其MDP元组元素,具体为一个基本的MDP模型通常是由S,a,P,R,γ五元组构成,其中S表示环境中的状态集合,a表示环境中可采取的动作集合,P是状态转移概率矩阵P(s′|s,a)表示在智能体状态s时执行动作a后转移到状态s′的概率,其中P(s′|s,a)=P(st+1=s′|st=s,at=a)∈[0,1],R是回报函数,Ra(s→s′)表示智能体在状态s时执行动作a后转移到状态s′时环境反馈回的回报值,γ为折扣系数,0≤γ≤1;

步骤S3、深度强化学习算法DDPG搭建

设计DDPG算法中的Actor网络和Critic网络,其中Actor和Critic网络均具有当前策略网络和目标策略网络;

其中Actor当前策略网络μ负责策略网络参数θ的迭代更新,根据当前智能体感知的状态S选择当前动作A;

其中Actor目标网络μ′负责根据经验回放池中采用的下一状态S′选择动作A′,网络参数θ′定期从θ复制;

其中Critic当前策略网络Q负责网络参数ω的迭代更新,负责计算当前状态S、动作A的Q值Q(S,A,ω);

其中Critic目标网络Q′负责计算下一状态S′、下一动作A′的Q′值Q′(S′,A′,ω′),网络参数ω′定期从ω复制;

步骤S4、模型训练

通过利用Actor当前策略网络μ感知当前状态并产生执行动作,获得环境反馈的奖励以及下一状态,将上述信息存入经验回放池;

Actor当前策略网络参数μ的训练使用损失梯度

Critic当前策略网络参数ω的训练使用均方损失函数进行反向传播更新参数,其中yj=Rj+γQ′(S′,A′,ω′)。

2.根据权利要求1所述的基于深度强化学习的Femtocell异构网络功率自适应优化方法,其特征在于:问题建模的问题模型描述如下:

s.t.Pmin≤Pi≤Pmax,i=1,...,N (1)

CMUE≥lMUE (2)

其中为Femtocell基站群选择的发射功率集合,式(1)表示FBS发射功率约束,式(2)、式(3)分别表示MUE、FUE信息约束。

3.根据权利要求2所述的基于深度强化学习的Femtocell异构网络功率自适应优化方法,其特征在于:

在步骤S2中,基于步骤S1中建立的系统模型,建立MDP过程,智能体为每一个Femtocell基站,即FBSi,i∈{1,...,N};动作集合设计为智能体FBS允许分配的发射功率,DDPG算法可在连续合法功率取值空间中进行功率决策,即每一个FBS都将从动作集合Pmin≤a∈A≤Pmax中选择一个发射功率;状态集合定义主要考虑到距离因素和阈值约束因素,对于第i个智能体FBS,在时刻t定义其状态s∈S为其中表示MUE在时刻t的信息容量是否超过了指定阈值lMUE,即状态表示FUE在时刻t信息容量是否超过设定阈值即表示在时刻t第i个FBS与MUE之间距离可取0、1、2、3四个值,当取0时说明第i个FBS与MUE距离很近,同理取3时说明距两者相距较远,即类似的,表示在时刻t第i个FBS与MBS之间距离可取0、1、2、3四个值,即定励函数的设计主要考虑到网络容量和约束关系,每一个智能体FBS选择、执行完动作级发射功率后获得的奖励

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马鞍山学院,未经马鞍山学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111079364.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top