[发明专利]一种基于随机博弈在线学习的众包用户信息年龄管理方法有效
申请号: | 201911056486.X | 申请日: | 2019-10-31 |
公开(公告)号: | CN111030764B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 陈艳姣;朱笑天 | 申请(专利权)人: | 武汉大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 齐晨涵 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 博弈 在线 学习 用户信息 年龄 管理 方法 | ||
1.一种基于随机博弈在线学习的众包用户信息年龄管理方法,其特征在于,包含以下步骤:
步骤1,初始化众包数据和当前信道的属性,具体包括:
输入初始随机探索概率参数θ0,折现系数γ,纳什均衡的近似参数∈,用户1和用户2生成数据包对应的单位成本{c1,c2},初始信息年龄AoI{f1(0),f2(0)},以及初始信道状态{q1(0),q2(0)};设置当前迭代数t=0;初始化用户1和用户2的状态均为s(0)={s1(0),s2(0)},在所有离散状态下的状态值{V1[s1(t),s2(t)],V2[s1(t),s2(t)]}及策略对ξ(0)={ξ1(0),ξ2(0)};
步骤2,计算随机探索概率参数
步骤3,两个用户均分别选择动作a(t)={a1(t),a2(t)};均以1-θ的概率根据当前策略对ξ(t)={ξ1(t),ξ2(t)}选择动作,或者以θ的概率随机选择动作;
步骤4,根据两个用户的动作以及用户当前状态,计算得到用户1对于众包平台的贡献比例和期望收益,用户2对于众包平台的贡献比例和期望收益;
在Δt时间内,计算用户i,i=1,2,在该时间段中产生的所有数据包的信息年龄AoI,用户i在t轮迭代后的信息年龄AoI;并计算得出t+1轮迭代中的用户信息年龄AoI的转移概率;
根据两个用户的动作a(t)={a1(t),a2(t)},以及用户当前状态s(t)={s1(t),s2(t)},可以计算得到用户1对于众包平台的贡献比例其中i=1,2,mi(t)是指用户i成功传输到众包平台的数据包数量,用户1的期望收益为r1[s(t),a(t)]=PoC1[s(t),a(t)]×W(t)-c1a1(t),其中W(t)是众包平台所提供的总奖励,同样,用户2对于众包平台的贡献比例为用户2的期望收益为r2[s(t),a(t)]=PoC2[s(t),a(t)]×W(t)-c2a2(t);
在Δt时间内,用户i所产生的数据包的总数可表示为Ji(t)=ai(t)×Δt,每一个数据包j都被标记为{τi,j,j,Ji(t)},分别表示其生成时间、次序和该时段内生成包的总数,τi,j表示用户i第j个数据包生成时间,对于每一个数据包j来说,其信息年龄AoI为其中αi,j是数据包j被众包平台成功接收的时间,Δi,l(t-1)是上一个时间段中最后一个被接收的数据包l的AoI,故可计算用户i在该时间段中产生的所有数据包的AoI为pi(t)指时间为t的时候,用户i的信道中,数据包成功传输的概率;用户i在t轮迭代后的AoI由fi(t)更新为众包用户的状态转换包括信道质量的转换和用户AoI的转换,两者是相互独立的,因此,t+1轮迭代中的用户状态s(t+1)={s1(t+1),s2(t+1)}的转移概率均为P[s(t+1)|s(t),a(t)]=P[f1(t+1)|f1(t),a1(t)]×P[f2(t+1)|f2(t),a2(t)]×P[q1(t+1)]×P[q2(t+1)],其中,P[f1(t+1)|f1(t),a1(t)]和P[f2(t+1)|f2(t),a2(t)]表示AoI的转移概率,用户1和用户2的信道状态q1和q2的转移概率P[q1(t+1)]和P[q2(t+1)]可根据无线电传播模型进行估计,AoI的转移概率为:
使用户1和用户2的策略达到近似纳什均衡,即最佳策略对;
用表示近似最佳策略对,对于任意状态s∈S,都有其中表示ξ2取的是对于任意ξ1来说,最优的下同,并且∈>0,因此,用户i在状态s下的状态值的计算可以写为其中,ri表示用户的收益,γ是折现系数;
两个用户的近似最佳策略对计算方式分别为和
其中,S表示状态集,Pr表示从状态s采集动作转移到s′的概率,s′表示不等于s的状态;
步骤5,利用步骤4中最佳策略对更新用户1用户2的最佳策略;
步骤6,根据步骤4所得结果分别更新两个用户的状态值;
步骤7,如果用户的策略收敛,结束算法并输出策略对;否则增值t,返回步骤2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911056486.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于变电站终端间隔的参数配置方法及配置工具
- 下一篇:一种模具的除锈工艺