[发明专利]一种基于强化学习的移动数据流量卸载方法有效
| 申请号: | 201810298887.5 | 申请日: | 2018-04-04 | 
| 公开(公告)号: | CN108494632B | 公开(公告)日: | 2020-12-01 | 
| 发明(设计)人: | 江昊;曾园园;李倩;刘冰清;胡芷毅;张毅;彭铎 | 申请(专利权)人: | 武汉大学 | 
| 主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/24;H04L12/911 | 
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 | 
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 强化 学习 移动 数据 流量 卸载 方法 | ||
1.一种基于强化学习的移动数据流量卸载方法,其特征在于,包括以下步骤:
步骤1:基于手机用户上网记录数据,进行用户流量需求分析,分别针对用户总流量和可卸载流量进行统计分析;
步骤1的具体实现包括以下子步骤:
步骤1.1:基于手机用户上网记录数据,针对用户总流量进行统计分析,统计各天中每个时段的用户总流量需求;
步骤1.2:基于手机用户上网记录数据,针对可卸载流量进行统计分析,统计各天中每个时段的可卸载流量;
步骤2:针对运营商、内容提供方和内容需求方,根据运营商效用函数、内容提供方效用函数、内容需求方效用函数和系统总效用函数,利用强化学习方法,求解令系统的总效用目标函数最优化的流量卸载策略;
步骤2的具体实现包括以下子步骤:
步骤2.1:设计运营商效用函数、内容提供方效用函数、内容需求方效用函数和系统总效用函数;
运营商的效用函数由提供流量的收益和成本两部分构成,令用户需求总流量为q,可卸载流量为f,流量卸载比例为x,则运营商的真实流量负载为q-fx,运营商的每单位流量定价为p,单位流量的成本为e,效用函数为:
U1(x)=(p-e)·(q-fx);
内容提供方的效用函数由提供流量的收益和成本两部分构成,内容提供方提供的总流量为可卸载流量f和卸载比例x的乘积fx,令内容提供方的每单位流量定价为d,内容提供方的单位流量成本为g,则内容提供方的效用函数为:
U2(x)=(d-g)fx;
内容需求方的效用由获得的流量收益和支付的费用两部分组成,如下式所示:
U3(x)=αlog(1+q)-p(q-fx)-dfx;
其中α是与用户体验相关的参数,第二项为支付给运营商的费用,第三项为支付给内容提供方的费用;
系统总效用目标函数为:
U(x)=λ1·U1(x)+λ2·U2(x)+λ3·U3(x)
s.t.λ1+λ2+λ3=1
λ1≥0;λ2≥0;λ3≥0;
λ1、λ2和λ3为三方效用函数的归一化权重,其中对三方的效用函数分别进行了归一化,并且限制了优化式中各权重的取值范围;
步骤2.2:利用强化学习中的Gradient Bandit算法,求解令系统的总效用目标函数最优化的流量卸载策略。
2.根据权利要求1所述的基于强化学习的移动数据流量卸载方法,其特征在于:步骤1.2中,利用用户之间的机会通信进行流量卸载,需要满足以下3个条件:用户对在时间、空间和内容维度有交集;因此对用户进行筛选,针对有相遇行为并且访问过相同类型的互联网内容的用户,进行流量需求统计,这一部分流量即为可卸载流量。
3.根据权利要求1-2任意一项所述的基于强化学习的移动数据流量卸载方法,其特征在于:步骤2中所述强化学习方法,在强化学习模型中有2类行为action,在第t轮迭代中,当action为1时,表示选择从运营商获取内容,相应的收益为Rt(1)=U(xt=0),当action为2时,表示选择从内容提供方获取内容,相应的收益为Rt(2)=U(xt=1);这2类action的偏好因子分别记为Ht(1)和Ht(2),初始时t=0,令Ht(1)=Ht(2)=0,则选择这2类action的概率分别为:
在后续t轮迭代中,πt(1)和πt(2)按照下式进行更新,假设当前t时刻的action为At,则迭代式为:
对于行为a≠At,则迭代式如下所示:
则选择行为a的概率为:
其中,α是可控参数,Rt是t时刻选择行为At的收益,是前t时刻选择行为At获得收益的平均值;在t+1时刻根据t时刻的概率πt(1)和πt(2),选择从运营商或内容提供方获取数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810298887.5/1.html,转载请声明来源钻瓜专利网。





