首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于强化学习的不完全信息智能抗干扰方法有效

申请号：	201811051896.0	申请日：	2018-09-10
公开（公告）号：	CN109274456B	公开（公告）日：	2020-05-01
发明（设计）人：	黎伟;王军;李黎;党泽;王杨	申请（专利权）人：	电子科技大学
主分类号：	H04K3/00	分类号：	H04K3/00;H04B17/345;H04B17/391
代理公司：	成都点睛专利代理事务所(普通合伙) 51232	代理人：	孙一峰
地址：	611731 四川省***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于强化学习不完全信息智能抗干扰方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于强化学习的不完全信息智能抗干扰方法，该方法用于在博弈理论基础上实现合法用户在不完全估计干扰源干扰方法的情况下做出通信策略动态调整，其特征在于，包括以下步骤：

S1、初始化定义，包括：

干扰环境：根据干扰者数量、干扰方式和无线信道模型定义干扰环境；

干扰环境状态：将不同时隙测得的频谱信息构成频谱时隙矩阵，频谱时隙矩阵大小由观测频谱范围和观测时隙长度决定；

回报函数：根据合法用户的通信质量指标构造反馈回报函数；

抗干扰策略：将不同子信道上的发射功率组合定义为抗干扰策略集；

所述的回报函数为：

其中，m∈{1,…,N}是信道索引号，N是信道个数，是干扰源在信道上的干扰功率，j∈{1,…,J}是干扰源索引号，J是干扰源个数；t是时序索引号；表示合法通信用户间的信道，为子信道发射功率，函数表示当f_j＝m时，输出1，否则输出0；是发射功率开销；

S2、将干扰环境状态，即频谱时隙矩阵通过卷积神经网络得到抗干扰策略，并将该策略作用于干扰环境，根据回报函数观测当前抗干扰策略下在干扰环境的回报值；

S3、将当前抗干扰策略、干扰环境状态和抗干扰策略下的回报值构成经验组存储到经验池；

S4、从经验池中抽样经验组对卷积神经网络进行训练和参数更新；

S5、判断学习机制是否满足预设的停止条件，若满足，则停止学习得到最后抗干扰策略；否则回到S2继续学习。

2.根据权利要求1所述的一种基于强化学习的不完全信息智能抗干扰方法，其特征在于，所述步骤S4的具体方法为：

卷积神经网络参数的训练，通过抽取的经验组中的当前状态和下一步状态通过卷积神经网络得到对应的状态行为值，并构建对应的损失函数，通过最小化损失函数进行网络参数的更新。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811051896.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种针对并发频谱访问模型的非合作式二级用户接收机
下一篇：一种方向盘及汽车

同类专利

专利分类

H04 电通信技术
H04K 保密通信
H04K3-00 对通信的干扰；反干扰

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top