[发明专利]基于Q学习资源分配策略的异构网络准入控制方法有效

专利信息
申请号: 201310167173.8 申请日: 2013-05-08
公开(公告)号: CN103220751A 公开(公告)日: 2013-07-24
发明(设计)人: 徐玉滨;陈佳美;马琳;赵洪林;崔扬;杨松 申请(专利权)人: 哈尔滨工业大学
主分类号: H04W48/06 分类号: H04W48/06
代理公司: 哈尔滨市松花江专利商标事务所 23109 代理人: 张宏威
地址: 150001 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要: 基于Q学习资源分配策略的异构网络准入控制方法,涉及一种异构网络准入控制方法。它是为了在兼顾网络整体性能和用户QoS需求,实现在异构网络的网络拥塞情况下进行用户呼叫准入控制。本发明采用Q学习方法控制门限控制模块中的门限设定,利用Q学习的自学习性质,动态的对有限的无线分配资源优先级分配。通过一段时间的学习,能够找到在不同的网络状态下,资源分配的最优策略。这样,用户的准入控制能够适应动态变化的网络环境,尤其在异构网络拥塞情况下,本发明的方法仍具有效性。本发明适用于异构网络下用户的准入控制。
搜索关键词: 基于 学习 资源 分配 策略 网络 准入 控制 方法
【主权项】:
1.基于Q学习资源分配策略的异构网络准入控制方法,其特征是:它由以下步骤实现:步骤一、在离线阶段,定义Q学习中的可执行动作集A,用于在Q学习过程中,设定两个不同的资源分配门限TH1与TH2;定义系统的立即回报函数pt(e,a),用于在每个当前状态et下系统执行可用动作后,作为网络环境对系统执行动作的回报,来判断系统执行动作的正确程度;初始化Q值表,对于每个可用的动作a分配一个对应的Q值,形成一个Q值表,对每个Q值在[0,1]区间内随机赋值;步骤二、在在线阶段,步骤二一、测量并记录WCDMA/WLAN异构网络当前时刻的网络状态et,作为门限估计模块的输入参数;t的初始值为1;步骤二二、当用户发起新呼叫或者切换呼叫时,采用门限估计模块根据网络状态et和与可用动作A对应的Q值表中最大Q值相应的动作来进行门限设定;并采用网络选择模块根据网络状态et和门限估计模块设定的门限接入或拒绝接入该用户,并记录当前的立即回报函数pt(e,a);步骤二三、将t的值加1,测量并记录WCDMA/WLAN异构网络在t+1时刻下的网络状态et+1;步骤二四、根据公式:Qt+1(e,a)=(1-α)Qt(e,a)+α{pt(e,a)+βVt(e)}对Q值表进行更新;式中:α是学习强度,α=0.1~0.2;β为折扣因子,且0<β<1;Qt+1(e,a)为异构网络在网络状态et+1下,更新后的Q值;Qt(e,a)为前一网络状态为网络状态et下的Q值,Vt(e)为值函数,所述Vt(e)的值通过公式:Vt(e)=maxb{Qt(e,b)}]]>获得,其中b是在状态et时的可选动作;步骤二五、判断该时刻下网络状态et+1时Q值与上一时刻的网络状态et的Q值的差值ΔQ(e,a),是否满足收敛条件ΔQ(e,a)<ε,a∈A;如果判断结果为是,则令t的值加1,并返回执行步骤二一;如果判断结果为否,则执行步骤二六;步骤二六、完成基于Q学习资源分配策略的异构网络准入控制。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310167173.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top