[发明专利]一种应用于混合动力汽车的控制方法及设备有效
| 申请号: | 201910595326.6 | 申请日: | 2019-07-03 |
| 公开(公告)号: | CN110481536B | 公开(公告)日: | 2020-12-11 |
| 发明(设计)人: | 郑春花;杨铖兆 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
| 主分类号: | B60W20/00 | 分类号: | B60W20/00;B60W50/00 |
| 代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 黄志云 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 应用于 混合 动力 汽车 控制 方法 设备 | ||
1.一种应用于混合动力汽车的控制方法,其特征在于,包括:
采集目标车辆在t时刻的运行状态参量;
将所述运行状态参量导入到控制指令输出网络,生成用于控制所述目标车辆的控制指令,通过所述控制指令控制所述目标车辆运行;
将所述运行状态参量以及所述控制指令导入到状态评分网络,计算所述控制指令对应的期望评分值;所述期望评分值用于表示所述目标车辆基于所述控制指令控制时的节能等级;
根据所述期望评分值以及所述控制指令计算所述t时刻的梯度值,并基于所述梯度值对所述控制指令输出网络进行调整;
将所述目标车辆在t+1时刻的运行状态参量导入到调整后的所述控制指令输出网络,生成关于t+1时刻的控制指令,并返回执行将所述运行状态参量以及所述控制指令导入到状态评分网络,计算所述控制指令对应的期望评分值;
在所述将所述运行状态参量导入到控制指令输出网络,生成用于控制所述目标车辆的控制指令,通过所述控制指令控制所述目标车辆运行之后,还包括:
采集所述目标车辆基于所述t时刻的控制指令运行下的节能等级;
将所述t时刻的运行状态参量、所述节能等级、所述控制指令以及所述t+1时刻的运行状态参量,创建网络训练对象,并将所述网络训练对象添加到训练数据库内;
根据各个所述网络训练对象的学习效率,对各个所述网络训练对象进行排序,并选取前K个所述网络训练对象作为目标训练对象;
通过K个所述目标训练对象更新所述控制指令输出网络以及所述状态评分网络;
所述根据各个所述网络训练对象的学习效率,对各个所述网络训练对象进行排序,并选取前K个所述网络训练对象作为目标训练对象,包括:
分别将各个所述网络训练对象导入到时序差分偏差转换函数,计算各个所述网络训练对象的时序差分偏差值;所述时序差分偏差转换函数具体为:
Δ=r+max Q(s',a';θ)-Q(s,a;θ)
其中,Δ为所述时序差分偏差值;s为在所述t时刻的运行状态参量;a为在所述t时刻的控制指令;s'为在所述t+1时刻的运行状态参量;a'为在所述t+1时刻的控制指令;Q(s,a;θ)为所述状态评分网络的函数;θ为所述状态评分网络的第二学习参量;r为在所述t时刻的节能等级;
将所述时序差分偏差值识别为所述学习效率,并基于所述学习效率对各个所述网络训练对象进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910595326.6/1.html,转载请声明来源钻瓜专利网。





