[发明专利]一种基于混合决策模型的小型无人机防控决策方法及系统有效
| 申请号: | 202110926857.6 | 申请日: | 2021-08-12 |
| 公开(公告)号: | CN113625569B | 公开(公告)日: | 2022-02-08 |
| 发明(设计)人: | 牛余凯;晋晓曦;李晋徽;温志津;刘阳 | 申请(专利权)人: | 中国人民解放军32802部队 |
| 主分类号: | G05B13/04 | 分类号: | G05B13/04 |
| 代理公司: | 北京丰浩知识产权代理事务所(普通合伙) 11781 | 代理人: | 李强 |
| 地址: | 100083 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 混合 决策 模型 小型 无人机 方法 系统 | ||
1.一种基于混合决策模型的小型无人机防控决策方法,其特征在于,所述方法包括:
获取小型无人机位置运动信息,构建小型无人机的三自由度质点运动模型;
构建小型无人机防控规则模型,使用小型无人机防控规则模型和三自由度质点运动模型描述小型无人机防控步骤;
依据马尔科夫决策过程构建状态空间S,动作空间A,奖励函数R;
建立基于dueling结构的D3QN网络,训练及优化防控决策模型;
根据防控决策模型,更新小型无人机防控规则模型;
所述依据马尔科夫决策过程构建状态空间S,动作空间A,奖惩函数R包括:
状态空间S为:
S=[dt,vt,at,et,ht,tl,tj] (2)
dt,vt,at,et,ht的表达式分别为:
at=tan-1[(ya-yb)/(xa-xb)],
ht=(zb-za),
其中,(xb,yb,zb)和(xb1,yb1,zb1)分别表示小型无人机在上一时刻t1和马尔科夫决策过程步进的当前时刻t的位置坐标,(xa,ya,za)表示探测设备的位置坐标;dt表示当前时刻小型无人机相对探测设备的距离;vt表示当前时刻小型无人机的飞行速率;tl表示出激光时间;tj表示开电子干扰的时间;at和et分别表示t时刻无人机相对地面目标的方位角和俯仰角;
动作空间A的表达式为:
A=[Js,Jp,Ls,Lp] (3)
其中,Js和Ls分别表示为干扰和激光设备的开关动作,取值为0或1;Jp和Lp分别表示为干扰功率和激光功率,具体取值为-1,0或1;
奖励函数R的表达式为:
R=μ1·Rdj+μ2·Rdl+μ3·Rv+μ4·Ra (5)
其中,Rdj、Rdl、Rv、Ra分别表示干扰距离奖励函数、拦截距离奖励函数、角度奖励函数和速度奖励函数;μ1、μ2、μ3、μ4分别为干扰距离奖励函数、拦截距离奖励函数、速度奖励函数和角度奖励函数对应的权值,其满足约束条件:μ1+μ2+μ3+μ4=1,μ1,μ2,μ3,μ4≥0;
Rdj、Rdl、Rv、Ra表达式为:
k为保持干扰和拦截距离奖励函数在最小奖励正值的平滑系数,和分别表示干扰最大作用距离和激光作用最大距离;分别表示小型无人机的速度低于最大速度阈值和高于最大速度阈值时所对应的奖励系数;vmi,vma和vxh分别表示小型无人机的最小速度、最大速度和巡航速度;q表示探测到的小型无人机径向连线与其速度矢量间的夹角;qm表示角度奖励值为最小奖励正值时的角度值;分别表示探测到无人机在范围内及无人机离开探测范围的奖励值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军32802部队,未经中国人民解放军32802部队许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110926857.6/1.html,转载请声明来源钻瓜专利网。





