[发明专利]基于POMDP的受控无线网络系统动态资源分配方法有效
| 申请号: | 201510271561.X | 申请日: | 2015-05-25 |
| 公开(公告)号: | CN105007582B | 公开(公告)日: | 2018-03-16 |
| 发明(设计)人: | 张延华;李萌;闫玉玮;孙恩昌;司鹏搏;杨睿哲;孙艳华 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | H04W16/10 | 分类号: | H04W16/10;H04W72/08 |
| 代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 刘萍 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 pomdp 受控 无线网络 系统 动态 资源 分配 方法 | ||
技术领域
本发明涉及一种基于部分可观察马尔可夫决策过程(POMDP)的受控无线通信网络系统动态资源分配方法,通过POMDP方法,设计一种有利于无线通信网络的资源分配的选择方案,属于受控无线网络与通信资源分配研究的相关领域。
背景技术
移动通信在近几十年来得到了迅猛发展,用户对无线通信网络的服务质量需求也在不断提高,促使无线通信系统正在从2G、3G、B3G、4G以及5G演进,网络主体也将从语音主导的网络向着高速数据为主导的网络转型。与此同时,移动多媒体业务对带宽的要求越来越高,“宽带化”成为移动通信技术的发展趋势。目前,影响无线通信网络服务质量(Quality of Service,QoS)主要有以下三个方面:第一,无线移动通信网络的高动态性、用户位置的随机改变带来的频繁切换操作和网络拓扑的易变性,将会导致数据传输速率和连通性的不稳定;第二,无线通信网络的信道衰落和移动终端的功率或能量受限等特性,导致小区用户接收到基站的功率损耗占有很大比重;第三,受基站和用户间的信道衰落、基站和用户的天线开启数、用户的信噪比等影响,数据传输中的误码率也会受很大影响,从而影响数据链路传输的可靠性。多年来,尽管业内对无线通信网络的设计算法等不断优化改进,提出了诸多改善网络服务质量的方法,推动了无线通信网络设计向前发展,但始终无法彻底解决诸如网络功耗损失、数据传输可靠性等问题,因此,基于传统的无线通信网络系统架构以及通信分层协议体系的设计和部署已不能更有效解决这些矛盾。
在控制工程领域,反馈控制策略作为最基本的控制方法,成为闭环控制系统的核心,对系统各个节点状态的控制、调节起到了至关重要的作用。反馈策略从提出之始,便在工业系统的闭环控制、信息论以及信道编码等领域获得了广泛而深入的应用。借助于反馈策略,控制系统本身具备了自调整、自适应和自镇定的能力,系统性能指标得到了全面的提高。与此同时,无线网络控制系统(Wireless Network Control Systems,WNCS)的研究引起国内外学者的高度关注。德国凯泽斯劳滕大学的L.Litz教授和A.Chamaken博士提出将无线通信网络嵌入工业控制系统中,设计满足控制系统性能指标需求的系统架构、控制算法以及无线通信网络架构和通信协议,从而提升系统的传感器、控制器和执行器之间对信息的处理和对系统的控制,实现了对工业控制系统的预测和优化。意大利拉奎拉大学的M.D.Di Benedetto等学者对WNCS设计有深入研究,他们提出了一个相关代价函数,利用该函数,首先将控制系统的噪声、编码、调制方式以及系统功率等参数映射到无线网络中,然后选择适当的无线网络类型,从而满足提升控制系统的鲁棒性和灵活性的需要。
部分可观察马尔可夫决策过程(POMDP)是通过引入信念状态空间将非马尔可夫链问题转化为马尔可夫链问题来求解,其最大的特点在于假设系统的状态信息不能直接观测得到,是部分可知的,对只有不完全状态信息的系统建模,依据当前的不完全状态信息做出决策,从而获得最大收益。这种状态转移模型更符合于无线通信网络场景中的部分状态信息不完全可知,需要通过观测从而获得最优资源分配的特点。
综上所述,本发明的主要目的是引入控制反馈优化策略,将POMDP模型应用于受控无线通信网络系统,通过给定小区用户接入数构成的状态转移概率矩阵和反馈网络QoS服务指标(用户接收功率和用户传输误码率)构成的观测概率矩阵,并根据某时刻的小区用户接入状态(Belief State)和对应的基站开启天线数的收益,从而预测判断下一时刻小区用户最优接入数;同时,根据最大收益,判决此时刻小区基站天线开启数,最终达到小区内基站天线、用户接入的最优资源分配。
发明内容
本发明的主要目的是在小区通信网络最优资源分配的角度上,考虑小区网络中存在一个多天线基站和多个用户的情况下,以每时刻接入用户数与小区开启天线数动态资源分配最优为优化目标,通过POMDP模型以及控制反馈策略的应用,完成小区基站天线开启与接入用户的最优资源分配策略。本方法解决了在小区网络中有多个天线的基站和多个通信用户的情况下,如何选择确定最优资源分配的问题,并通过最优资源分配获得小区无线通信网络系统的最大收益。
本发明所适应的小区环境场景模型见图1。
本发明技术方案中的系统运行原理流程图见图2。
本发明系统用户接收功率基站情况对比图见图3。
本发明系统误码率情况对比图见图4。
本发明系统小区内不同条件下平均收益对比图见图5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510271561.X/2.html,转载请声明来源钻瓜专利网。





