[发明专利]基于ε-贪婪的在线序贯感知与机会接入方法有效
申请号: | 201310006343.4 | 申请日: | 2013-01-08 |
公开(公告)号: | CN103179675A | 公开(公告)日: | 2013-06-26 |
发明(设计)人: | 王金龙;吴启晖;李柏文;郑学强 | 申请(专利权)人: | 中国人民解放军理工大学通信工程学院 |
主分类号: | H04W74/08 | 分类号: | H04W74/08 |
代理公司: | 南京天华专利代理有限责任公司 32218 | 代理人: | 夏平 |
地址: | 210016 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 贪婪 在线 感知 机会 接入 方法 | ||
技术领域
本发明涉及无线通信技术中的认知无线电领域,具体讲是针对统计未知的机会频谱接入系统中,最优序贯感知顺序的在线学习方法。
背景技术
受频谱监管部门的倡议和认知无线电技术进步的驱动,动态频谱接入(DSA)已经被广泛认可为提高频谱利用率的有效手段。为了保护主用户通信不受影响,认知用户在接入信道前需要对信道进行频谱感知,以确保信道空闲。受限于硬件水平,认知终端通常一次只能感知整个频段的一小部分。在此情况下,如何合理的安排感知顺序,将直接影响系统的吞吐量和接入时延。实现最优的信道感知与接入中的一个关键难点,就是难以预估的信道统计分布,尤其是实际的异构网络场景下,不同信道的可用概率和链路质量不尽相同。
在线学习,由于其与生俱来的自适应性和有效性,已经被广泛应用于动态无线网络中。通过限定认知用户在每个时隙中只感知一个信道,现有的在线接入研究将此类问题建模为经典的多臂老虎机(MAB:Multi-Armed Bandit)分析模型。即用户只需要根据对信道收益的统计,在每个时隙选择一个信道接入,来最大化系统累计吞吐量。尽管这种简单的“每时隙选一个信道”的研究模型在同步的周期感知系统中有一定的合理性,但在更多的分布式认知网络里,尤其是点对点通信场景,这种简单模型并不合适。一方面,由于信道感知时间通常都远远小于传输时隙(比如,TV信道的感知时间通常为10毫秒级,而主用户保护约束下的传输时隙为2秒),当用户感知发现当前信道占用时,直接切换到下一信道进行频谱感知比在原信道等待下一次传输时隙更为合理且有效。另一方面,由于无线信道状态的随机性,切换信道进行感知通常都能获得更多的传输机会,即获得多信道分集增益。并且,由于可用信道的数目众多(比如,超过半数的用户拥有20个以上的可用TV信道),这种分集增益还是非常可观的。
基于此,本发明针对统计未知的异构信道网络下,提出一种基于在线学习的 序贯信道感知与接入策略。不同于以往方法中限制每时隙只选择一个信道感知接入,在本方案的模型中,允许用户在每个时隙中序贯地感知信道,并机会的接入进行传输。由此,通过实时动态地调整感知顺序和接入策略,最大化系统在一定时间段上的累积吞吐量收益。
发明内容
本发明提出了一种动态频谱环境中基于ε-贪婪的在线序贯感知与机会接入方法,以解决在统计信息未知时,序贯感知顺序学习与累积吞吐量优化的问题。
本发明是采用以下技术方案实现的:
一种基于ε-贪婪算法的在线序贯感知与机会接入方法,在每个时隙中,用户序贯地感知信道,并机会的接入进行传输。
本发明中,包括初始化相关参数的步骤和在每一个时隙进行的基于在线学习的接入决策的步骤。
本发明中,初始化相关参数的步骤具体包括:
1.1对每个信道i,i∈{1,...,N},初始化各信道空闲概率估计各信道被感知的次数统计ni=0;
1.2初始化候选信道集合S0={1,...,N},其中N为信道总数;
1.3初始化ε-贪婪算法的控制参数ε=ε0,ε0的取值与信道总数N相关,根据网络场景中的信道数目N,ε0取0.5~2.5之间的一个值。
本发明中,所述的算法控制参数ε0的取值与信道总数N的关系,如表1所示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军理工大学通信工程学院,未经中国人民解放军理工大学通信工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310006343.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:发光二极管光源仿真系统
- 下一篇:三角函数曲线绘图仪