[发明专利]一种基于强化学习的多约束下的卫星姿态机动规划方法有效
| 申请号: | 202110162955.7 | 申请日: | 2021-02-05 |
| 公开(公告)号: | CN112937918B | 公开(公告)日: | 2022-06-17 |
| 发明(设计)人: | 华冰;孙胜刚;郑墨泓;吴云华;陈志明 | 申请(专利权)人: | 南京航空航天大学 |
| 主分类号: | B64G1/24 | 分类号: | B64G1/24 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 熊玉玮 |
| 地址: | 210016 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 强化 学习 约束 卫星 姿态 机动 规划 方法 | ||
1.一种基于强化学习的多约束下的卫星姿态机动规划方法,其特征在于,
在卫星本体坐标系下建立强制指向约束和禁止指向约束,所述卫星本体坐标系为理想条件下zB轴指向地心、-yB轴指向日心、xB轴正方向根据右手定则确定的笛卡尔坐标系;
以翻滚角、俯仰角和偏航角为策略建立强化学习模型,所述强化学习模型通过内层迭代更新每个时刻的策略梯度且通过外层迭代更新各时刻的策略,更新策略梯度的总回报函数根据卫星对地对日定向精度以及禁止指向约束建立;
从卫星满足对地定向精度或对日定向精度的姿态解集中抽取与参考目标姿态相关的姿态解生成数据库;
根据数据库初始化强化学习模型,通过内层迭代根据各时刻的策略差及修正策略的期望价值函数更新策略梯度直至策略梯度收敛,对内层迭代中止得到的策略梯度进行修正后得到用于更新每个时刻策略的最终策略梯度;
从强化学习模型每次外层迭代结束得到的策略中筛选出每个时刻满足卫星对地对日定向精度以及姿态约束的策略,对筛选出的策略进行平滑处理得到每个时刻的最终姿态规划结果;其中,
所述总回报函数为:其中,x1,k(m)、x2,k(m)和x3,k(m)分别为卫星在第k次迭代中当前时刻m的翻滚角俯仰角θk(m)和偏航角,Rd,k(m)为第k次外层迭代中当前时刻m的策略下与对地和对日定向精度相关的回报函数,zB,k(m)为第k次外层迭代中当前时刻m下的卫星本体坐标系zB轴,μearth为卫星本体坐标系zB轴对地夹角的权重,zO,k(m)为第k次外层迭代中当前时刻m下的质心轨道坐标系zO轴,μsun为质心轨道坐标系zO轴对日夹角的权重,yB,k(m)为第k次外层迭代中当前时刻m下的卫星本体坐标系yB轴,Rsun,k(m)为第k次外层迭代中当前时刻m下的太阳矢量,Rm-i-j,k(m)是第k次外层迭代中当前时刻m的策略下与第i个敏感器视场中心轴和第j个反射光区域中心轴夹角相关的回报函数,μf-j-i为第i个敏感器视场中心轴和第j个反射光区域中心轴相对于卫星位置矢量的夹角的回报函数的权重系数,为第k次外层迭代中当前时刻m下第i个敏感器的视场中心轴,为第k次外层迭代中当前时刻m下第j个反射光区域中心轴相对于卫星的位置矢量,NO为敏感器个数,NJ为反射光区域总数,Rs,k(m)为第k次外层迭代中当前时刻m的策略下太阳位置矢量与所有敏感器视场中心轴的夹角相关的回报函数,μsun-i为与太阳位置矢量和第i个敏感器视场中心轴夹角相关的回报函数的权重系数;
通过内层迭代根据各时刻的策略差及修正策略的期望价值函数更新策略梯度的方法为:
计算第k次外层迭代中第kG次内层迭代时当前时刻m的策略差q=1时表示翻滚角差值,q=2时表示俯仰角差值,q=3时表示偏航角差值,xq,k-2(m)为第k-2次外层迭代中当前时刻m的策略,xq,k-1(m)为第k-1次外层迭代中当前时刻m的策略,η为学习步长;
根据第k次外层迭代中每次内层迭代计算的当前时刻m的策略差及修正策略的期望价值更新第k次外层迭代中当前时刻m的策略梯度Gq,k(m),为第k次外层迭代中第0次、第1次内层迭代时当前时刻m的策略差,为第k次外层迭代中第1次、第2次、第kG次内层迭代修正策略的期望价值,
从强化学习模型每次迭代结束得到的策略中筛选出每个时刻满足卫星对地对日定向精度以及姿态约束的策略的指标为:χ(k)为关于第k次外层迭代得到的所有策略的函数,zB,k(m),zO,k(m)为第k次外层迭代中当前时刻m下卫星本体坐标系zB轴和质心轨道坐标系zO轴的夹角,-yB,k(m),Rsun,k(m)为第k次外层迭代中当前时刻m下卫星本体坐标系-yB轴和太阳位置矢量Rsun的夹角,为第k次外层迭代中当前时刻m下翻滚角的均方差,σ(θk(m))为第k次外层迭代中当前时刻m下俯仰角θk(m)的均方差,σ(ψk(m))为第k次外层迭代中当前时刻m下偏航角的均方差,υ1、υ2、υ3为权重系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110162955.7/1.html,转载请声明来源钻瓜专利网。





