[发明专利]基于回溯Q学习的雷达抗干扰智能决策方法在审
申请号: | 202211150864.2 | 申请日: | 2022-09-21 |
公开(公告)号: | CN115508790A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 兰岚;张翔;廖桂生;朱圣棋;许京伟 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G01S7/36 | 分类号: | G01S7/36;G01S7/487;G01S7/497 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 侯琼;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 回溯 学习 雷达 抗干扰 智能 决策 方法 | ||
1.一种基于回溯Q学习的雷达抗干扰智能决策方法,其特征在于,包括如下步骤:
(1)建立1张PJ行、PA列的Q表格,其中PJ为干扰样式种类的排列组合数量,PA为抗干扰方法的数量;
(2)雷达对回波信号x(k)进行检测,识别获取回波信号里的所有干扰样式;
(3)雷达按照先空域后时频域的基本原则,使用贪婪算法从总抗干扰算法库中选择一个抗干扰方法;
(4)雷达使用所选择的抗干扰方法对回波信号进行处理,得到处理后数据,并构建干扰抑制的评价指标;若选择的抗干扰方法与回波信号中的某种干扰样式相对应,则不论该干扰样式是否已被抑制,均认为该干扰样式已消除,干扰状态发生转变;
(5)雷达判断当前处理的干扰样式是否为最后一种,若不是,则按照如下公式对Q表格进行更新:
反之,若当前处理的干扰为最后一种干扰,则按照下式对Q表格进行更新:
Q'(st,ai)=Q(st,ai)+α[ζ-Q(st,ai)],
其中,st表示干扰状态;ai表示第i种抗干扰方法,i∈1...PA;st+1表示系统在干扰状态为st时,使用抗干扰方法ai之后的干扰状态;Q(st,ai)表示系统在干扰状态为st时,选择抗干扰方法ai的Q值;表示系统干扰状态为st+1时,所有抗干扰方法中最大的Q值;ζ表示评价指标,α为学习率,γ为折扣系数;
(6)雷达在对回波信号里的每一种干扰样式都进行处理之后,对本轮Q表格中的关键节点进行回溯更新,所述关键节点定义为:若某时刻回波信号干扰状态为st,雷达执行抗干扰方法ai后,干扰状态发生了改变,则认为Q(st,ai)为此轮处理中的关键节点,且每轮回溯更新时,各关键节点的回溯更新Q值相同;回溯更新具体步骤如下:
(6a)计算回溯更新Q值:
其中,whs=[w1,w2,…,wP]T表示回溯更新权值,ζhs=[ζ1,ζ2,…,ζP]T表示干扰抑制的评价指标,m为Q(st,ai)被认定为关键节点的次数;
(6b)根据下式回溯更新Q表格中的各关键节点:
其中,Qhs代表回溯更新的Q值,α为学习率。
2.根据权利要求1所述的方法,其特征在于:步骤(3)中从抗干扰算法库中选择一个抗干扰方法,具体是:定义一个贪婪系数ε,且0<ε<1;令系统在抗干扰算法库进行随机选择或根据Q表格进行选择,其中随机选择的概率为ε、根据Q表格进行选择的概率为1-ε;所述系统在抗干扰算法库中根据Q表格进行选择是根据Q表格中当前干扰状态所在的行,选择其中最大Q值对应的抗干扰方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211150864.2/1.html,转载请声明来源钻瓜专利网。