[发明专利]一种时限约束下的能量收集认知无线电网络接入方法在审
申请号: | 202111530900.3 | 申请日: | 2021-12-15 |
公开(公告)号: | CN114172599A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 张一晋;张凯;沈世林;林艳;邹骏 | 申请(专利权)人: | 南京理工大学 |
主分类号: | H04B17/382 | 分类号: | H04B17/382;G06K9/62 |
代理公司: | 南京鼎傲知识产权代理事务所(普通合伙) 32327 | 代理人: | 刘蔼民 |
地址: | 210094 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时限 约束 能量 收集 认知 无线电 网络 接入 方法 | ||
1.一种时限约束下的能量收集认知无线电网络接入方法,其特征在于,具体步骤为:
步骤1、确定部分观测马尔可夫决策过程的相关参数,所述相关参数包括:描述在时隙t开始时刻次发送端的状态st、描述时隙t的开始时刻状态处于st时,次发送端选择的动作at、描述次发送端在状态st=s∈S时采取动作at=(x,y)∈As转移到状态st+1=s′∈S的转移概率Pr(s′|s,x,y)、描述次发送端在时隙t开始时刻的观测ot、描述次发送端在状态st=s∈S采取动作at=(x,y)∈As转移到状态st+1=s′∈S时得到观测ot=o的观测函数Pr(o|s,x,y,s')、描述基于时隙t之前所有历史信息和观测的条件下时隙t开始时刻次发送端状态的置信状态It、描述在时隙t开始时刻置信状态It=I时,次发送端采取动作at=(x,y)∈As所获得的即时奖励Rt(I,x,y)、描述一系列从当前置信状态映射到当前时隙动作的策略π。
步骤2、基于决策过程Zt,确定次用户吞吐率指标ψ(π);
步骤3、基于决策过程Zt,利用QMDP算法确定感知接入动作at。
2.根据权利要求1所述的时限约束下的能量收集认知无线电网络接入方法,其特征在于,步骤1中的部分观测马尔可夫决策过程的相关参数的确定方法具体为:
步骤1-1、确定部分观测马尔可夫决策过程{Zt,t=0,1,L},即无限时域马尔可夫决策过程,次发送端在每个时隙开始时刻做出决策;
步骤1-2、确定状态st,st满足st@其中it∈{-1,0,L,D-1},当0≤it≤D-1时其表示时隙t开始时刻次发送端队首数据包的逗留时间,D为数据包的传输时限,it=-1表示时隙t开始时刻次发送端数据队列为空;jt∈{0,1,L,L}表示时隙t开始时刻次发送端所具有的能量单元数目,L为储存能量单元的能量储存器的容量;则表示时隙t开始时刻的信道n状态。将st所有可能取值组成的集合称之为状态空间,并标记为S。
步骤1-3、确定行为at,at满足:其中,Xt为次发送端在时隙t开始时刻可选工作模式(0表示表示能量收集模式、1表示数据传输模式)的集合,当0≤jt≤m或it=-1时Xt={0},而当m+1≤jt≤L且it≥0时Xt={0,1};Yt={1,2,L,N}表示次发送端用于传输数据或收集能量的信道标号的集合。
步骤1-4、确定状态转移概率Pr(s′|s,x,y),其计算公式为:
其中表示信道n的状态从cn转移到cn'的概率,记C0,0(n)为αn,C1,0(n)为βn;Pr(i',j'|i,j,x,y,cn)为信道n在时隙t开始时刻的状态时次发送端采取动作at=(x,y)∈As、次发送端状态从it=i,jt=j转移到it+1=i′,jt+1=j′的概率。
给定信道n在时隙t开始时刻的状态以及动作at=(x,y)∈As时,将次发送端数据分组及能量储存状态的转移概率矩阵标记为Px,y,并在下面分情况详细列出。
①当x=0,y=n即次发送端选择能量收集模式时,
其中,Px,y的每一行均对应于队首数据包的逗留时间,Bi,i′(n)代表队首数据包的逗留时间从当前时隙的i转移到下一时隙的i′,而Bi,i′(n)每一行均对应能量储存器中能量单元的数目。
Bi,i′(n)可分为i=-1和i≥0两种情况进行考虑。
当i=-1即次发送端在当前时隙开始时刻无数据包等待发送时,下一时隙开始时刻的队首数据包逗留时间i'=-1或1,并且次发送端所储存能量将不会减少,因此可获得:
当i≥0即次发送端在当前时隙开始时刻有数据包等待发送时,Bi,i′(n)可进一步分为两种情况进行考虑:当0≤i≤D-2即队首数据包逗留时间在下一时隙开始时刻未到达传输时限时,能量仅在选择信道状态为忙碌时会有所增加,而队首数据包逗留时间i′=i+1,因此可获得:
而当i=D-1即队首数据包逗留时间在下一时隙开始时刻已到达传输时限时,当前时隙的队首数据包在下一时隙开始时刻必被移出队列,从而只需关注队列第二个数据包于何时到达,因此可通过几何分布推导得:
②当x=1,y=n即次发送端选择数据传输模式时,
Bi,i′(n)可分为以下三种情况进行考虑。
当0≤i≤D-2,m+1≤j≤L、信道忙碌或信道错误导致传输失败,队首数据包逗留时间i′=i+1,因此可得:
当0≤i≤D-2,m+1≤j≤L时,信道状态空闲且未发生信道错误时,队首数据包传输成功,队首数据包逗留时间i′=i-k,其中0≤k≤i+1,因此可得:
其中λ-1=1,当t>l时
当i=D-1即队首数据包逗留时间在下一时隙开始时刻已到达传输时限时,当前时隙的队首数据包在下一时隙开始时刻必被移出队列,进而使得队首数据包逗留时间将由i=D-1转移至i′=D-1-k,其中0≤k≤D,因此可得:
步骤1-5、确定观测ot,ot满足:其中表示次发送端对时隙t开始时刻队首数据包逗留时间的观测;表示次发送端对时隙t开始时刻所储存能量单元数目的观测;表示次发送端对时隙t开始时刻信道n状态的观测,表示观测结果为空闲;表示观测结果为忙碌;表示无观测。
步骤1-6、确定观测函数Pr(o|s,x,y,s'),Pr(o|s,x,y,s')计算公式为:
其中为信道n的观测函数,为队首数据包逗留时间和能量储存器能量单元数目的观测函数。由于都是完全观测,与动作无关,因此可得:
而次发送端仅能观测所选择信道状态,因此信道观测函数为:
步骤1-7、确定置信状态It,It满足:
It@[bt(s1),bt(s2),...,bt(s|S|)]
对于任意s∈S,bt(s)∈[0,1]且∑s∈Sbt(s)=1。时隙t+1开始时刻的置信状态It+1由时隙t开始时刻的置信状态It、时隙t时次发送端的动作at=(x,y)∈At以及时隙t时次发送端的观测ot=o按照贝叶斯法则进行如下更新:
It+1@f(It,x,y,o)
步骤1-8、确定奖励Rt(I,x,y),Rt(I,x,y)的计算公式为:
Rt(I,x,y)@∑s∈Sbt(s)rt(s,x,y)
其中rt(s,x,y)为时隙t开始时刻st=s∈S时,次发送端采取动作at=(x,y)∈As所获得的即时奖励,即
由上式可看出,Rt(I,x,y)和rt(s,x,y)与时隙t无关,因此可简写为R(I,x,y)、r(s,x,y)。
步骤1-9、信道接入策略π由一系列从当前置信状态到当前时隙动作的映射函数得出,即:
π@[μ1,L,μt,L],whereμt:It→Ast,
可见π属于确定性策略。将所有可能π的集合标记为Π。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111530900.3/1.html,转载请声明来源钻瓜专利网。