[发明专利]一种新能源飞机的永磁同步电机DQN智能控制方法在审
| 申请号: | 202110854369.9 | 申请日: | 2021-07-28 |
| 公开(公告)号: | CN113343592A | 公开(公告)日: | 2021-09-03 |
| 发明(设计)人: | 齐义文;李鑫;赵铁楠;刘远强;项松;王书礼;康桂文;赵为平;张弛;侯百乐 | 申请(专利权)人: | 辽宁锐翔通用飞机制造有限公司;沈阳航空航天大学 |
| 主分类号: | G06F30/27 | 分类号: | G06F30/27 |
| 代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
| 地址: | 110132 辽宁省*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 新能源 飞机 永磁 同步电机 dqn 智能 控制 方法 | ||
1.一种新能源飞机的永磁同步电机DQN智能控制方法,其特征在于,包括:
步骤1:建立新能源飞机的永磁同步电机数学模型;
步骤2:定义永磁同步电机控制Agent、状态空间S、动作空间A和奖励函数Reward;
步骤3:利用深度Q网络强化学习方法对深度神经网络进行训练,得到训练后的深度神经网络;
步骤4:利用训练后的深度神经网络控制永磁同步电机。
2.根据权利要求1所述的一种新能源飞机的永磁同步电机DQN智能控制方法,其特征在于,所述步骤1包括:
步骤1.1:根据矢量控制原理完成SVPWM算法的建模;
步骤1.2:根据新能源飞机的不同飞行状态及功率确定永磁同步电机的内部参数。
3.根据权利要求1所述的一种新能源飞机的永磁同步电机DQN智能控制方法,其特征在于,所述步骤2包括:
步骤2.1:永磁同步电机控制智能体Agent使用深度Q网络强化学习方法,构建深度神经网络QV为值网络,初始化经验回放记忆池D为空;
步骤2.2:设计状态空间S、动作空间A和奖励函数Reward。
4.根据权利要求1所述的一种新能源飞机的永磁同步电机DQN智能控制方法,其特征在于,所述步骤3包括:
步骤3.1:构造和值网络QV结构相同的目标网络QT,初始化动作选择机制ε-greedy算法中的ε,ε取值范围为0~1;
步骤3.2:将当前永磁同步电机状态s输入至值网络QV中,输出当前永磁同步电机状态s下所有动作a的Q值Q(s,a;θV),生成一个随机数rand,rand取值范围为0~1,如果randε,则从动作空间A中随机选择一个动作a作为控制器输出,即a∈U(A),U(A)为动作空间A的集合;如果rand≥ε,则令a=argmaxQ(s,a;θV),其中argmaxQ(s,a;θV)为取最大Q值所对应动作a的函数;
步骤3.3:永磁同步电机转移到下一个状态s',通过奖励函数Reward计算奖励值r,并将样本(s,a,r,s')送至经验回放记忆池D中;
步骤3.4:经验回放记忆池D中存满数据后,随机采样q个数据,通过误差反向传播最小化损失函数ri为第i个数据所记录奖励值,θT为深度神经网络的网络参数,γ为折扣因子,采用梯度下降法更新QV网络参数θV,进而实现深度神经网络的训练;
步骤3.5:每隔ξ个仿真周期将更新后值网络QV中的参数θV复制到QT中,即θT=θV;
步骤3.6:重复步骤3.2~步骤3.5直到单轮仿真累计奖励值大于所设定的阈值,得到训练后的深度神经网络。
5.根据权利要求1所述的一种新能源飞机的永磁同步电机DQN智能控制方法,其特征在于,所述步骤4包括:
步骤4.1:令ε-greedy算法中的ε=0,使Agent利用训练后的深度神经网络进行永磁同步电机的控制;
步骤4.2:将永磁同步电机模型当前状态s输入至深度值网络QV,输出当前永磁同步电机状态s下所有动作a的Q值Q(s,a;θV),使得a=argmaxQ(s,a;θV),执行动作a,重复步骤4.2实现对永磁同步电机控制。
6.根据权利要求2所述的一种新能源飞机的永磁同步电机DQN智能控制方法,其特征在于:所述步骤1.1中采用id=0的矢量控制策略,SVPWM算法为七段式SVPWM算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁锐翔通用飞机制造有限公司;沈阳航空航天大学,未经辽宁锐翔通用飞机制造有限公司;沈阳航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110854369.9/1.html,转载请声明来源钻瓜专利网。





