[发明专利]基于多智能体增强学习算法的Walker星座轨道摄动补偿方法在审
申请号: | 201710534592.9 | 申请日: | 2017-07-03 |
公开(公告)号: | CN107330277A | 公开(公告)日: | 2017-11-07 |
发明(设计)人: | 蔡润斌;张帆;范翔 | 申请(专利权)人: | 北京跟踪与通信技术研究所 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京奥翔领智专利代理有限公司11518 | 代理人: | 路远 |
地址: | 100094 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 智能 增强 学习 算法 walker 星座 轨道 摄动 补偿 方法 | ||
1.一种基于多智能体增强学习算法的Walker星座轨道摄动补偿方法,其特征在于,包括如下步骤:
A、初始化增强学习算法的状态集S、动作集A和Q值表;
B、根据当前状态和共享策略即共享Q值表设计动作a,根据动作a得到当前回报r和Q值表,并更新Q值表;
C、判断当前Q值是否符合同轨道面的共享策略,即共享Q值表,若不符合,则执行步骤D;
D、判断当前几何精度因子GDOP值是否满足设计要求,如果否,则执行步骤E;
E、循环执行步骤B~步骤D,直至GDOP评价模型满足卫星星座长期稳定运行条件。
2.根据权利要求1所述基于多智能体增强学习算法的Walker星座轨道摄动补偿方法,其特征在于,所述步骤A之前进一步包括:
通过标称轨道和星座摄动模型计算出整个星座在标称轨道下的升交点赤经漂移ΔΩ和沿迹角漂移Δλ:
3.根据权利要求1或2所述基于多智能体增强学习算法的Walker星座轨道摄动补偿方法,其特征在于,步骤A还包括:
将初始轨道偏置量,即轨道半长轴Δa0和倾角偏置Δi0作为多智能体增强学习算法的初始动作输入;其中:
式(3)中j代表第j个轨道面,每个轨道面均有m颗卫星;所述动作是指摄动偏置补偿。
4.根据权利要求1所述基于多智能体增强学习算法的Walker星座轨道摄动补偿方法,其特征在于,步骤B所述根据动作a得到当前回报r和Q值表,具体包括:
B1、根据星座摄动模型和GDOP评价模型得到当前每颗卫星的环境回报r1jk和其中j=1,2,…F,k=1,2,…m,即第j个轨道面的第k个卫星;
B2、各智能体独立选择动作集A中的动作a进行学习,并得到每颗卫星环境回报rijk和Q值表
5.根据权利要求4所述基于多智能体增强学习算法的Walker星座轨道摄动补偿方法,其特征在于,步骤B2所述得到每颗卫星环境回报rijk是通过比较GDOP值是增大还是减小得到的,具体为:GDOP增大环境回报rijk为-1,减小rijk为1,相等则为0。
6.根据权利要求1所述基于多智能体增强学习算法的Walker星座轨道摄动补偿方法,其特征在于,步骤C所述判断当前Q值是否符合同轨道面的共享策略,即共享Q值表,具体为:判断同轨道面内的卫星是否满足共享Q值表的条件。
7.根据权利要求1或6所述基于多智能体增强学习算法的Walker星座轨道摄动补偿方法,其特征在于,步骤C还包括:
若符合,则同轨道面共享该Q值表,然后执行步骤D。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京跟踪与通信技术研究所,未经北京跟踪与通信技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710534592.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:神经影像图检索方法及装置
- 下一篇:基于混合架构的区域医疗影像信息系统及方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用