[发明专利]基于回溯Q学习的雷达抗干扰智能决策方法在审

专利信息
申请号: 202211150864.2 申请日: 2022-09-21
公开(公告)号: CN115508790A 公开(公告)日: 2022-12-23
发明(设计)人: 兰岚;张翔;廖桂生;朱圣棋;许京伟 申请(专利权)人: 西安电子科技大学
主分类号: G01S7/36 分类号: G01S7/36;G01S7/487;G01S7/497
代理公司: 陕西电子工业专利中心 61205 代理人: 侯琼;王品华
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 回溯 学习 雷达 抗干扰 智能 决策 方法
【权利要求书】:

1.一种基于回溯Q学习的雷达抗干扰智能决策方法,其特征在于,包括如下步骤:

(1)建立1张PJ行、PA列的Q表格,其中PJ为干扰样式种类的排列组合数量,PA为抗干扰方法的数量;

(2)雷达对回波信号x(k)进行检测,识别获取回波信号里的所有干扰样式;

(3)雷达按照先空域后时频域的基本原则,使用贪婪算法从总抗干扰算法库中选择一个抗干扰方法;

(4)雷达使用所选择的抗干扰方法对回波信号进行处理,得到处理后数据,并构建干扰抑制的评价指标;若选择的抗干扰方法与回波信号中的某种干扰样式相对应,则不论该干扰样式是否已被抑制,均认为该干扰样式已消除,干扰状态发生转变;

(5)雷达判断当前处理的干扰样式是否为最后一种,若不是,则按照如下公式对Q表格进行更新:

反之,若当前处理的干扰为最后一种干扰,则按照下式对Q表格进行更新:

Q'(st,ai)=Q(st,ai)+α[ζ-Q(st,ai)],

其中,st表示干扰状态;ai表示第i种抗干扰方法,i∈1...PA;st+1表示系统在干扰状态为st时,使用抗干扰方法ai之后的干扰状态;Q(st,ai)表示系统在干扰状态为st时,选择抗干扰方法ai的Q值;表示系统干扰状态为st+1时,所有抗干扰方法中最大的Q值;ζ表示评价指标,α为学习率,γ为折扣系数;

(6)雷达在对回波信号里的每一种干扰样式都进行处理之后,对本轮Q表格中的关键节点进行回溯更新,所述关键节点定义为:若某时刻回波信号干扰状态为st,雷达执行抗干扰方法ai后,干扰状态发生了改变,则认为Q(st,ai)为此轮处理中的关键节点,且每轮回溯更新时,各关键节点的回溯更新Q值相同;回溯更新具体步骤如下:

(6a)计算回溯更新Q值:

其中,whs=[w1,w2,…,wP]T表示回溯更新权值,ζhs=[ζ12,…,ζP]T表示干扰抑制的评价指标,m为Q(st,ai)被认定为关键节点的次数;

(6b)根据下式回溯更新Q表格中的各关键节点:

其中,Qhs代表回溯更新的Q值,α为学习率。

2.根据权利要求1所述的方法,其特征在于:步骤(3)中从抗干扰算法库中选择一个抗干扰方法,具体是:定义一个贪婪系数ε,且0<ε<1;令系统在抗干扰算法库进行随机选择或根据Q表格进行选择,其中随机选择的概率为ε、根据Q表格进行选择的概率为1-ε;所述系统在抗干扰算法库中根据Q表格进行选择是根据Q表格中当前干扰状态所在的行,选择其中最大Q值对应的抗干扰方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211150864.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top