[发明专利]一种时限约束下的能量收集认知无线电网络接入方法在审

专利信息
申请号: 202111530900.3 申请日: 2021-12-15
公开(公告)号: CN114172599A 公开(公告)日: 2022-03-11
发明(设计)人: 张一晋;张凯;沈世林;林艳;邹骏 申请(专利权)人: 南京理工大学
主分类号: H04B17/382 分类号: H04B17/382;G06K9/62
代理公司: 南京鼎傲知识产权代理事务所(普通合伙) 32327 代理人: 刘蔼民
地址: 210094 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 时限 约束 能量 收集 认知 无线电 网络 接入 方法
【权利要求书】:

1.一种时限约束下的能量收集认知无线电网络接入方法,其特征在于,具体步骤为:

步骤1、确定部分观测马尔可夫决策过程的相关参数,所述相关参数包括:描述在时隙t开始时刻次发送端的状态st、描述时隙t的开始时刻状态处于st时,次发送端选择的动作at、描述次发送端在状态st=s∈S时采取动作at=(x,y)∈As转移到状态st+1=s′∈S的转移概率Pr(s′|s,x,y)、描述次发送端在时隙t开始时刻的观测ot、描述次发送端在状态st=s∈S采取动作at=(x,y)∈As转移到状态st+1=s′∈S时得到观测ot=o的观测函数Pr(o|s,x,y,s')、描述基于时隙t之前所有历史信息和观测的条件下时隙t开始时刻次发送端状态的置信状态It、描述在时隙t开始时刻置信状态It=I时,次发送端采取动作at=(x,y)∈As所获得的即时奖励Rt(I,x,y)、描述一系列从当前置信状态映射到当前时隙动作的策略π。

步骤2、基于决策过程Zt,确定次用户吞吐率指标ψ(π);

步骤3、基于决策过程Zt,利用QMDP算法确定感知接入动作at

2.根据权利要求1所述的时限约束下的能量收集认知无线电网络接入方法,其特征在于,步骤1中的部分观测马尔可夫决策过程的相关参数的确定方法具体为:

步骤1-1、确定部分观测马尔可夫决策过程{Zt,t=0,1,L},即无限时域马尔可夫决策过程,次发送端在每个时隙开始时刻做出决策;

步骤1-2、确定状态st,st满足st@其中it∈{-1,0,L,D-1},当0≤it≤D-1时其表示时隙t开始时刻次发送端队首数据包的逗留时间,D为数据包的传输时限,it=-1表示时隙t开始时刻次发送端数据队列为空;jt∈{0,1,L,L}表示时隙t开始时刻次发送端所具有的能量单元数目,L为储存能量单元的能量储存器的容量;则表示时隙t开始时刻的信道n状态。将st所有可能取值组成的集合称之为状态空间,并标记为S。

步骤1-3、确定行为at,at满足:其中,Xt为次发送端在时隙t开始时刻可选工作模式(0表示表示能量收集模式、1表示数据传输模式)的集合,当0≤jt≤m或it=-1时Xt={0},而当m+1≤jt≤L且it≥0时Xt={0,1};Yt={1,2,L,N}表示次发送端用于传输数据或收集能量的信道标号的集合。

步骤1-4、确定状态转移概率Pr(s′|s,x,y),其计算公式为:

其中表示信道n的状态从cn转移到cn'的概率,记C0,0(n)为αn,C1,0(n)为βn;Pr(i',j'|i,j,x,y,cn)为信道n在时隙t开始时刻的状态时次发送端采取动作at=(x,y)∈As、次发送端状态从it=i,jt=j转移到it+1=i′,jt+1=j′的概率。

给定信道n在时隙t开始时刻的状态以及动作at=(x,y)∈As时,将次发送端数据分组及能量储存状态的转移概率矩阵标记为Px,y,并在下面分情况详细列出。

①当x=0,y=n即次发送端选择能量收集模式时,

其中,Px,y的每一行均对应于队首数据包的逗留时间,Bi,i′(n)代表队首数据包的逗留时间从当前时隙的i转移到下一时隙的i′,而Bi,i′(n)每一行均对应能量储存器中能量单元的数目。

Bi,i′(n)可分为i=-1和i≥0两种情况进行考虑。

当i=-1即次发送端在当前时隙开始时刻无数据包等待发送时,下一时隙开始时刻的队首数据包逗留时间i'=-1或1,并且次发送端所储存能量将不会减少,因此可获得:

当i≥0即次发送端在当前时隙开始时刻有数据包等待发送时,Bi,i′(n)可进一步分为两种情况进行考虑:当0≤i≤D-2即队首数据包逗留时间在下一时隙开始时刻未到达传输时限时,能量仅在选择信道状态为忙碌时会有所增加,而队首数据包逗留时间i′=i+1,因此可获得:

而当i=D-1即队首数据包逗留时间在下一时隙开始时刻已到达传输时限时,当前时隙的队首数据包在下一时隙开始时刻必被移出队列,从而只需关注队列第二个数据包于何时到达,因此可通过几何分布推导得:

②当x=1,y=n即次发送端选择数据传输模式时,

Bi,i′(n)可分为以下三种情况进行考虑。

当0≤i≤D-2,m+1≤j≤L、信道忙碌或信道错误导致传输失败,队首数据包逗留时间i′=i+1,因此可得:

当0≤i≤D-2,m+1≤j≤L时,信道状态空闲且未发生信道错误时,队首数据包传输成功,队首数据包逗留时间i′=i-k,其中0≤k≤i+1,因此可得:

其中λ-1=1,当t>l时

当i=D-1即队首数据包逗留时间在下一时隙开始时刻已到达传输时限时,当前时隙的队首数据包在下一时隙开始时刻必被移出队列,进而使得队首数据包逗留时间将由i=D-1转移至i′=D-1-k,其中0≤k≤D,因此可得:

步骤1-5、确定观测ot,ot满足:其中表示次发送端对时隙t开始时刻队首数据包逗留时间的观测;表示次发送端对时隙t开始时刻所储存能量单元数目的观测;表示次发送端对时隙t开始时刻信道n状态的观测,表示观测结果为空闲;表示观测结果为忙碌;表示无观测。

步骤1-6、确定观测函数Pr(o|s,x,y,s'),Pr(o|s,x,y,s')计算公式为:

其中为信道n的观测函数,为队首数据包逗留时间和能量储存器能量单元数目的观测函数。由于都是完全观测,与动作无关,因此可得:

而次发送端仅能观测所选择信道状态,因此信道观测函数为:

步骤1-7、确定置信状态It,It满足:

It@[bt(s1),bt(s2),...,bt(s|S|)]

对于任意s∈S,bt(s)∈[0,1]且∑s∈Sbt(s)=1。时隙t+1开始时刻的置信状态It+1由时隙t开始时刻的置信状态It、时隙t时次发送端的动作at=(x,y)∈At以及时隙t时次发送端的观测ot=o按照贝叶斯法则进行如下更新:

It+1@f(It,x,y,o)

步骤1-8、确定奖励Rt(I,x,y),Rt(I,x,y)的计算公式为:

Rt(I,x,y)@∑s∈Sbt(s)rt(s,x,y)

其中rt(s,x,y)为时隙t开始时刻st=s∈S时,次发送端采取动作at=(x,y)∈As所获得的即时奖励,即

由上式可看出,Rt(I,x,y)和rt(s,x,y)与时隙t无关,因此可简写为R(I,x,y)、r(s,x,y)。

步骤1-9、信道接入策略π由一系列从当前置信状态到当前时隙动作的映射函数得出,即:

π@[μ1,L,μt,L],whereμt:It→Ast,

可见π属于确定性策略。将所有可能π的集合标记为Π。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111530900.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top